Indhold
I matematiske termer er et "middelværdi" et gennemsnit. Gennemsnittene beregnes for at repræsentere et datasæt meningsfuldt. For eksempel kunne en meteorolog fortælle dig, at gennemsnitstemperaturen for 22. januar i Chicago er 25 grader F baseret på tidligere data. Dette nummer kan ikke forudsige den nøjagtige temperatur for næste 22. januar i Chicago, men det fortæller dig nok at vide, at du skal pakke en jakke, hvis du skal til Chicago på den dato. To almindeligt anvendte midler er det aritmetiske middelværdi og det geometriske middelværdi. At vide, hvilken man skal bruge til dine data betyder at forstå deres forskelle.
Formler til beregning
Den mest åbenlyse forskel mellem det aritmetiske middelværdi og det geometriske middelværdi for et datasæt er, hvordan de beregnes. Det aritmetiske middelværdi beregnes ved at tilføje alle numrene i et datasæt og dele resultatet med det samlede antal datapunkter.
Eksempel: Aritmetisk gennemsnit på 11, 13, 17 og 1.000 = (11 + 13 + 17 + 1.000) / 4 = 260.25
Det geometriske middelværdi af et datasæt beregnes ved at multiplicere numrene i datasættet og tage den niende rod af resultatet, hvor "n" er det samlede antal datapunkter i sættet.
Eksempel: Geometrisk middelværdi af 11, 13, 17 og 1.000 = 4. rod af (11 x 13 x 17 x 1.000) = 39.5
Effekten af Outliers
Når du ser på resultaterne af beregningerne for det aritmetiske middelværdi og det geometriske middelværdi, bemærker du, at effekten af outliers er meget dæmpet i det geometriske middelværdi. Hvad betyder det? I datasættet 11, 13, 17 og 1.000 kaldes tallet 1.000 en "outlier", fordi dets værdi er meget højere end alle de andre. Når det aritmetiske middelværdi beregnes, er resultatet 260,25. Bemærk, at intet tal i datasættet endda er tæt på 260,25, så det aritmetiske middelværdi er ikke repræsentativt i dette tilfælde. Outliers-effekten er overdrevet. Det geometriske middelværdi ved 39,5 gør et bedre stykke arbejde med at vise, at de fleste numre fra datasættet ligger inden for området 0 til 50.
Anvendelser
Statistikere bruger aritmetiske midler til at repræsentere data uden væsentlige outliers. Denne type middelværdi er god til at repræsentere gennemsnitlige temperaturer, fordi alle temperaturer for 22. januar i Chicago vil være mellem -50 og 50 grader F. En temperatur på 10.000 grader F er bare ikke ved at ske. Ting som batting gennemsnit og gennemsnitlige racerbilhastigheder er også godt repræsenteret ved hjælp af aritmetiske midler.
Geometriske midler anvendes i tilfælde, hvor forskellene mellem datapunkter er logaritmiske eller varierer med multipla af 10. Biologer bruger geometriske midler til at beskrive størrelserne på bakteriepopulationer, der kan være 20 organismer en dag og 20.000 den næste. Økonomer kan bruge geometriske midler til at beskrive indkomstfordelinger. Du og de fleste af dine naboer tjener muligvis omkring $ 65.000 om året, men hvad nu hvis fyren op på bakken tjener $ 65 millioner om året? Det aritmetiske gennemsnit af indkomsten i dit kvarter vil være vildledende her, så et geometrisk middel ville være mere passende.