Indhold
Statistikeren og evolutionærbiologen Ronald Fisher udviklede ANOVA eller variansanalyse for at være et middel til et mål. Det kan hjælpe dig med at finde ud af, om resultaterne af et eksperiment, en undersøgelse eller en undersøgelse kan understøtte hypotesen. Ved hjælp af ANOVA kan du hurtigt beslutte, om en hypotese er sand eller falsk.
Hvad er ANOVA?
AnOVA, der bruges til at evaluere afvigelserne mellem gruppemetoder i en prøve, er en samling af statistiske modeller og deres relaterede estimeringsprocedurer. Det er dybest set variationen mellem to kendte datagrupper. Det tilbyder en statistisk test af, om populationsmidlet i flere datasæt faktisk er ens. Derefter generaliseres t-testen, eller en analyse af to populationsmidler gennem statistisk undersøgelse, til mere end to grupper. En t-test viser, om der er en signifikant forskel mellem befolkningsgennemsnittet og en antaget værdi. Størrelsen på forskellen i forhold til variationen i eksempeldata er t-værdien.
En eller to måder?
Antallet af uafhængige variabler i analysen af varianstest, som du bruger, bestemmer, om ANOVA er den ene eller den anden. En envejstest har en enkelt uafhængig variabel med to niveauer. En tovejsanalyse af varianstest har to uafhængige variabler. En to-vejs test kan have en række niveauer. Et eksempel på en envejs ville være at sammenligne to mærker af gelé. En tovejs vil sammenligne mærker af gelé såvel som kalorier, fedt, sukker eller kulhydratniveauer.
Niveauene inkluderer de forskellige grupper, der alle er i den samme uafhængige variabel. Replikering er, når du gentager testene med flere grupper. En tovejsanalyse af varians med replikation bruger to grupper og individer, der er inden for denne gruppe, der gør flere ting. To-vejs ANOVA-test kan udføres med eller uden replikation.
Sådan gør du ANOVA med hånden
Der findes statistisk software, der hurtigt og nemt kan beregne ANOVA, men det er en fordel at beregne ANOVA for hånd. Det giver dig mulighed for at forstå de enkelte trin, der er involveret, og hvordan de hver især bidrager til at vise forskellene mellem de flere grupper.
Saml de grundlæggende oversigtsstatistikker over de data, du har indsamlet. Den opsummerende statistik inkluderer de individuelle datapunkter for den første gruppe, mærket "x", og antallet af datapunkter for den anden individuelle variant, "y." Antallet af datapunkter for hver gruppe er mærket "n."
Tilføj punkterne for den første gruppe, der er mærket "SX." Den anden gruppe data indsamlet er "SY."
For at beregne middelværdien skal du bruge formlen, C = (SX + SY) ^ 2 / (2n).
Beregn summen af kvadratet mellem grupperne, SSB = - C.
Når du har kvadreret alle datapunkterne, opsummer de dem i en sluttsumme på "D."
Derefter beregnes summen af firkanter i alt, SST = D - C.
Brug formlen SST - SSB til at finde SSW eller summen af firkanter inden for grupper.
Figur graderne af frihed for mellem grupperne, "dfb," og inden for grupperne, "dfw."
Formlen for mellem grupper er dfb = 1 og for de inden for grupper er den dfw = 2n-2.
Beregn middelkvadratet for inden for grupper, MSW = SSW / dfw.
Til sidst skal du beregne den endelige statistik, eller "F," F = MSB / MSW