Sådan beregnes interkvartilområdet

Posted on
Forfatter: Monica Porter
Oprettelsesdato: 22 Marts 2021
Opdateringsdato: 19 November 2024
Anonim
Sådan beregnes interkvartilområdet - Videnskab
Sådan beregnes interkvartilområdet - Videnskab

Indhold

Det interkvartile interval, ofte forkortet som IQR, repræsenterer intervallet fra den 25th percentil til den 75. percentil eller den midterste 50 procent af ethvert givet datasæt. Det interkvartile interval kan bruges til at bestemme, hvad det gennemsnitlige præstation for en test ville være: du kan bruge det til at se, hvor de fleste folks score på en bestemt test falder, eller bestemme, hvor mange penge den gennemsnitlige medarbejder i en virksomhed tjener hver måned . Det interkvartile interval kan være et mere effektivt værktøj til dataanalyse end middelværdien eller medianen for et datasæt, fordi det giver dig mulighed for at identificere spredningsområdet i stedet for kun et enkelt tal.


TL; DR (for lang; læste ikke)

Interkvartilområdet (IQR) repræsenterer de midterste 50 procent af et datasæt. For at beregne det, skal du først bestille dine datapunkter fra mindst til størst, derefter bestemme dine første og tredje kvartilpositioner ved hjælp af formlerne (N + 1) / 4 og 3 * (N + 1) / 4, hvor N er tallet af punkter i datasættet. Til sidst trækker den første kvartil fra den tredje kvartil for at bestemme interkvartilområdet for datasættet.

Bestil datapunkter

Beregning af interkvartil rækkevidde er en simpel opgave, men inden beregningen skal du arrangere de forskellige punkter i dit datasæt. For at gøre dette skal du begynde med at bestille dine datapunkter fra mindst til størst. Hvis dine datapunkter f.eks. Var 10, 19, 8, 4, 9, 12, 15, 11 og 20, ville du omarrangere dem på denne måde: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Når dine datapunkter er blevet ordnet sådan, kan du gå videre til næste trin.


Bestem placering af første kvartil

Derefter bestemmes placeringen af ​​den første kvartil ved hjælp af følgende formel: (N + 1) / 4, hvor N er antallet af punkter i datasættet. Hvis den første kvartil falder mellem to tal, skal du tage gennemsnittet af de to numre som din første kvartil-score. I ovenstående eksempel, da der er ni datapunkter, vil du tilføje 1 til 9 for at få 10 og derefter dele med 4 for at få 2,5. Da den første kvartil falder mellem den anden og den tredje værdi, vil du tage gennemsnittet 8 og 9 for at få en første kvartil-position på 8,5.

Bestem tredje kvartilsposition

Når du har bestemt din første kvartil, skal du bestemme placeringen af ​​den tredje kvartil ved hjælp af følgende formel: 3 * (N + 1) / 4, hvor N igen er antallet af punkter i datasættet. Ligeledes, hvis den tredje kvartil falder mellem to tal, skal du blot tage gennemsnittet, som du ville gøre, når du beregner den første kvartil-score. I ovenstående eksempel, da der er ni datapunkter, vil du tilføje 1 til 9 for at få 10, ganges med 3 for at få 30 og derefter dele med 4 for at få 7,5. Da den første kvartil falder mellem den syvende og den ottende værdi, vil du tage gennemsnittet 15 og 19 for at få et tredje kvartilskår på 17.


Beregn interkvartil rækkevidde

Når du har bestemt din første og tredje kvartil, skal du beregne interkvartilområdet ved at trække værdien af ​​det første kvartil fra værdien af ​​det tredje kvartil. For at afslutte det eksempel, der blev brugt i løbet af denne artikel, trækker du 8.5 fra 17 for at finde ud af, at datasættets interkvartile interval er lig med 8.5.

Fordele og ulemper ved IQR

Interkvartilområdet har en fordel ved at være i stand til at identificere og eliminere outliers på begge ender af et datasæt. IQR er også et godt mål for variation i tilfælde af skæv datadistribution, og denne metode til beregning af IQR kan arbejde for grupperede datasæt, så længe du bruger en kumulativ frekvensfordeling til at organisere dine datapunkter. Interkvartilintervallformlen for grupperede data er den samme som for ikke-grupperede data, idet IQR er lig med værdien af ​​den første kvartil, der trækkes fra værdien af ​​den tredje kvartil. Det har dog adskillige ulemper sammenlignet med standardafvigelse: mindre følsomhed over for et par ekstreme score og en prøveudtagningsstabilitet, der ikke er så stærk som standardafvigelse.