Indhold
I statistikker er variansanalysen (ANOVA) en måde at analysere forskellige datagrupper sammen for at se, om de er beslægtede eller lignende. En vigtig test inden for ANOVA er root-middelkvadratfejl (MSE). Denne mængde er en måde at estimere forskellen mellem de værdier, der er forudsagt af en statistisk model, og de målte værdier fra det faktiske system. Beregning af rod MSE kan udføres i et par lige trin.
Summen af firkantede fejl (SSE)
Beregn det samlede gennemsnit for hver gruppe af datasæt. For eksempel kan du sige, at der er to datagrupper, sæt A og sæt B, hvor sæt A indeholder numrene 1, 2 og 3, og sæt B indeholder numrene 4, 5 og 6. Gennemsnittet af sæt A er 2 (fundet af tilsætning af 1, 2 og 3 sammen og dividering med 3) og middelværdien af sæt B er 5 (fundet ved at tilføje 4, 5 og 6 sammen og dividere med 3).
Trækker gennemsnittet af dataene fra de individuelle datapunkter, og kvadrater den efterfølgende værdi. For eksempel giver subtraktion 1 i datasættet A en gennemsnit på 2 en værdi på -1. At kvadratere dette nummer (dvs. multiplicere det med sig selv) giver 1. Gentagelse af denne proces for resten af dataene fra sæt A giver 0, og 1, og for sæt B er tallene også 1, 0 og 1 .
Resumér alle de kvadratiske værdier. Fra det forrige eksempel giver summen af alle firkantede numre tallet 4.
Beregning af rod MSE i ANOVA
Find graden af frihed for fejl ved at trække det samlede antal datapunkter ud med graden af frihedsgrad til behandling (antallet af datasæt). I vores eksempel er der seks samlede datapunkter og to forskellige datasæt, hvilket giver 4 som graden af frihedsgrad for fejl.
Del summen af firkantsfejl med graden af frihed for fejl. Fortsættelse af eksemplet ved at dividere 4 med 4 giver 1. Dette er den gennemsnitlige kvadratfejl (MSE).
Tag firkantede rod af MSE. Afslutningen af eksemplet, kvadratroten af 1 er 1. Derfor er rod MSE for ANOVA 1 i dette eksempel.