Sådan beregnes RMSD

Posted on
Forfatter: Robert Simon
Oprettelsesdato: 23 Juni 2021
Opdateringsdato: 15 November 2024
Anonim
Sådan beregnes RMSD - Videnskab
Sådan beregnes RMSD - Videnskab

Indhold

Når du udfører et eksperiment, der giver en række observerede værdier, som du vil sammenligne med teoretiske værdier, rod-middel-kvadratafvigelse (RMSD) eller root-mean-square error (RMSE) giver dig mulighed for at kvantificere denne sammenligning. Du beregner RMSD ved at finde kvadratroten af ​​den gennemsnitlige kvadratfejl.


RMSD-formlen

For en række observationer beregner du middelkvadratfejl ved at finde forskellen mellem hver eksperimentel eller observeret værdi og den teoretiske eller forudsagte værdi, kvadrere hver forskel, tilføje dem og dele dem med antallet af observerede værdier eller forudsagte værdier der er .

Dette gør RMSD-formlen:

{RMSD} = sqrt { frac { sum (x_e - x_o) ^ 2} {n}}

til xe forventede værdier xo observerede værdier og n samlet antal værdier.

Denne metode til at finde en forskel (eller afvigelse), kvadrere hver forskel, opsummere dem og dele med antallet af datapunkter (som du ville gøre, når du finder gennemsnittet af et datasæt) og derefter tage kvadratroten af ​​resultatet er hvad der giver mængden sit navn, "rod-middel-kvadratafvigelse." Du kan bruge en trin-for-trin-tilgang som denne til at beregne RMSD i Excel, hvilket er godt til store datasæt.


Standardafvigelse

Standardafvigelse måler, hvor meget et sæt data varierer i sig selv. Du kan beregne det ved hjælp af (Σ (x - μ)2 / n)1/2 for hver værdi x til n værdier med μ ("mu") gennemsnit. Bemærk, at dette er den samme formel for RMSD, men i stedet for forventede og observerede dataværdier bruger du selve dataværdien og gennemsnittet af datasættet. Ved hjælp af denne beskrivelse kan du sammenligne rod-middelkvadratfejl kontra standardafvigelse.

Dette betyder, at selvom det har en formel med en lignende struktur som RMSD, måler standardafvigelse et specifikt hypotetisk eksperimentelt scenarie, hvor de forventede værdier er hele gennemsnittet af datasættet.

I dette hypotetiske scenarie er mængden inde i kvadratroden (Σ (x - μ)2 / n) kaldes varians, hvordan dataene er fordelt omkring middelværdien. Ved at bestemme variansen kan du sammenligne datasættet med specifikke distributioner, som du ville forvente, at dataene skulle tage på baggrund af forudgående viden.


Hvad RMSD fortæller dig

RMSD giver en specifik, samlet måde at bestemme, hvordan fejl i, hvordan forudsagte værdier adskiller sig fra observerede værdier for eksperimenter. Jo lavere RMSD, desto mere nøjagtige er de eksperimentelle resultater til teoretiske forudsigelser. De lader dig kvantificere, hvordan forskellige fejlkilder påvirker de observerede eksperimentelle resultater, såsom luftmodstand, der påvirker en pendulsvinkling eller overfladespænding mellem en væske og dens beholder, der forhindrer den i at strømme.

Du kan yderligere sikre, at RMSD afspejler rækkevidden af ​​datasættet ved at dividere det med forskellen mellem den maksimale observerede eksperimentelle værdi og minimumet for at opnå normaliseret rod-middel-kvadratafvigelse eller fejl.

Inden for molekylær docking, hvor forskere sammenligner den teoretiske computergenererede struktur af biomolekyler med dem fra eksperimentelle resultater, kan RMSD måle, hvor tæt eksperimentelle resultater afspejler teoretiske modeller. Jo mere eksperimentelle resultater er i stand til at gengive, hvad teoretiske modeller forudsiger, jo lavere er RMSD.

RMSD i praktiske indstillinger

Foruden eksemplet med molekylær docking bruger meteorologer RMSD til at bestemme, hvor tæt matematiske modeller af klima forudsiger atmosfæriske fænomener. Bioinformatikere, forskere, der studerer biologi ved hjælp af computerbaserede metoder, bestemmer, hvordan afstanden mellem atomære positioner af proteinmolekyler varierer fra den gennemsnitlige afstand til disse atomer i proteiner ved hjælp af RMSD som et mål for nøjagtighed.

Økonomer bruger RMSD til at finde ud af, hvor tæt økonomiske modeller passer til målte eller observerede resultater af økonomisk aktivitet. Psykologer bruger RMSD til at sammenligne observeret opførsel af psykologiske eller psykologibaserede fænomener med beregningsmodeller.

Neurovidenskabsfolk bruger det til at bestemme, hvordan kunstige eller biologisk-baserede systemer kan lære sammenlignet med modeller for læring. Computervidenskabsfolk, der studerer billedbehandling og vision, sammenligner effektiviteten af, hvor godt en model kan rekonstruere billeder til de originale billeder ved hjælp af forskellige metoder.