Indhold
- TL; DR (for lang; læste ikke)
- Forskellen mellem tillidsniveau vs. tillidsinterval
- Beregning af tillidsintervaller eller niveauer for store prøver
- Beregning af tillidsintervaller for små prøver
Statistik handler om at drage konklusioner i lyset af usikkerhed. Hver gang du tager en prøve, kan du ikke være helt sikker på, at din prøve virkelig afspejler den befolkning, den er trukket fra. Statistikere håndterer denne usikkerhed ved at tage de faktorer, der kan påvirke estimatet, ved at kvantificere deres usikkerhed og udføre statistiske test for at drage konklusioner fra disse usikre data.
Statistikere bruger tillidsintervaller til at specificere en række værdier, der sandsynligvis vil indeholde den "sande" populationsværdi på grundlag af en stikprøve, og udtrykke deres sikkerhedsniveau i dette gennem tillidsniveauer. Selvom beregning af konfidensniveauer ikke ofte er nyttigt, er beregning af konfidensintervaller for et givet konfidensniveau en meget nyttig færdighed.
TL; DR (for lang; læste ikke)
Beregn et konfidensinterval for et givet konfidensniveau ved at multiplicere standardfejlen med Z score for dit valgte selvtillidsniveau. Træk dette resultat fra dit prøve middelværdi for at få den nedre grænse, og tilføj det til prøven gennemsnit for at finde den øvre grænse. (Se ressourcer)
Gentag den samme proces, men med t score i stedet for Z score for mindre prøver (n < 30).
Find et konfidensniveau for et datasæt ved at tage halvdelen af størrelsen på konfidensintervallet, multiplicere det med kvadratroten af prøvestørrelsen og derefter dele med prøvestandardafvigelsen. Slå det resulterende op Z eller t score i en tabel for at finde niveauet.
Forskellen mellem tillidsniveau vs. tillidsinterval
Når du ser en citeret statistik, er der undertiden et interval, der er givet efter det, med forkortelsen "CI" (for "konfidensinterval") eller blot et plus-minus-symbol efterfulgt af et tal. F.eks. "Middelvægten af en voksen mand er 180 pund (CI: 178,14 til 181,86)" eller "den gennemsnitlige vægt af en voksen mand er 180 ± 1,86 pund." Disse begge fortæller dig den samme information: baseret på prøven brugt, falder en menneskes middelvægt sandsynligvis inden for et bestemt interval. Intervallet kaldes tillidsintervallet.
Hvis du vil være så sikker som muligt på, at området indeholder den rigtige værdi, kan du udvide området. Dette vil øge dit "tillidsniveau" i estimatet, men intervallet dækker flere potentielle vægte. De fleste statistikker (inklusive den citerede ovenfor) er angivet som 95 procent konfidensintervaller, hvilket betyder, at der er en 95 procent chance for, at den ægte middelværdi er inden for området. Du kan også bruge et 99-procentvis konfidensniveau eller et 90-procentigt tillidsniveau afhængigt af dine behov.
Beregning af tillidsintervaller eller niveauer for store prøver
Når du bruger et konfidensniveau i statistikker, har du normalt brug for det for at beregne et konfidensinterval. Dette er lidt lettere at gøre, hvis du har en stor prøve, for eksempel over 30 personer, fordi du kan bruge Z score for dit estimat snarere end mere kompliceret t scores.
Tag dine rådata, og bereg udvalgsværdien (tilføj blot de individuelle resultater og divider med antallet af resultater). Beregn standardafvigelsen ved at trække gennemsnittet fra hvert individuelt resultat for at finde forskellen og derefter kvadratere denne forskel. Tilføj alle disse forskelle, og del derefter resultatet med prøvestørrelsen minus 1. Tag kvadratroten til dette resultat for at finde prøvestandardafvigelsen (Se Ressourcer).
Bestem konfidensintervallet ved først at finde standardfejlen:
SE = s / √n
Hvor s er din prøve standardafvigelse og n er din prøve størrelse. Hvis du for eksempel tog en prøve på 1.000 mænd for at beregne en mands gennemsnitsvægt og fik en prøvestandardafvigelse på 30, ville dette give:
SE = 30 / √1000 = 30 / 31.62 = 0.95
For at finde konfidensintervallet herfra skal du slå op det konfidensniveau, du vil beregne intervallet for i en Z-score-tabel og multiplicer denne værdi med Z score. For et 95 procent konfidensniveau er Z-score er 1,96. Ved hjælp af eksemplet betyder dette:
Gennemsnit ± Z × SE= 180 pund ± 1,96 × 0,95 = 180 ± 1,86 pund
Her er ± 1,86 pund 95 procent konfidensinterval.
Hvis du i stedet har denne bit information sammen med prøvestørrelsen og standardafvigelsen, kan du beregne konfidensniveauet ved hjælp af følgende formel:
Z = 0,5 × størrelse af konfidensinterval × √n / s
Størrelsen på konfidensintervallet er kun to gange ± værdien, så i eksemplet ovenfor ved vi, 0,5 gange dette er 1,86. Dette giver:
Z = 1.86 × √1000 / 30 = 1.96
Dette giver os en værdi for Z, som du kan slå op i en Z-score-tabel for at finde det tilsvarende tillidsniveau.
Beregning af tillidsintervaller for små prøver
For små prøver er der en lignende proces til beregning af konfidensintervallet. Træk først 1 fra din prøvestørrelse for at finde din "frihedsgrader." I symboler:
df = n −1
For en prøve n = 10, dette giver df = 9.
Find din alfaværdi ved at trække decimalversionen af konfidensniveauet (dvs. dit procentvise konfidensniveau divideret med 100) fra 1 og dividere resultatet med 2 eller i symboler:
α = (1 - decimal konfidensniveau) / 2
Så for et 95 procent (0,95) konfidensniveau:
α = (1 – 0.95) / 2 = 0.05 / 2 = 0.025
Slå din alfaværdi og frihedsgrader op i en (en hale) t distributionstabel og noter resultatet. Alternativt skal du udelade opdelingen med 2 ovenfor og bruge en to-hale t værdi. I dette eksempel er resultatet 2.262.
Som i det foregående trin, beregne konfidensintervallet ved at multiplicere dette tal med standardfejlen, som bestemmes ved hjælp af din prøvestandardafvigelse og prøvestørrelse på samme måde. Den eneste forskel er den i stedet for Z score, du bruger t score.