Ethvert datasæt, der er akkumuleret til statistiske formål, såsom U.S.-folketællingsdata, indeholder oplysninger, der kræver summering og aggregering. Det er næsten umuligt at anføre attributterne, for eksempel som individuelle indkomster og familiestørrelser. Statistikere bruger grafer for frekvensfordeling til at skildre dataene på en omfattende måde. For eksempel deler et histogram data op i klasseintervaller og tæller den hyppighed, hvormed alle medlemmerne, der hører til det pågældende klasseinterval, forekommer.Selvom der ikke er nogen strenge regler for beregning af størrelse og antal klassintervaller, er der nogle nyttige konventionelle kriterier.
Beregn dataområdet, dvs. forskellen mellem de højeste og laveste datapunkter. Antag for eksempel, at den højest betalte person i USA tjener 30 milliarder dollars om året og den laveste tjener nul. Området er lig med 30 - 0, hvilket svarer til 30 milliarder dollars.
Bestemm antallet af klasser ud fra prøvestørrelsen. Som tommelfingerregel bruges fem til syv klasser til prøvestørrelse op til 50, otte til 10 klasser til prøvestørrelse mellem 50 og 100, 10 til 15 klasser til prøvestørrelse mellem 100 og 250 og 15 til 20 klasser til prøvestørrelse større end 250.
Beregn klasseintervallet ved hjælp af følgende formel: Klasseinterval = interval ÷ antal klasser. Hvis du har 15 indkomstklasser i fordelingen af indkomsteksempel, skal du arbejde 30 ÷ 15 = 2 milliarder dollars. Ofte ignorerer statistikere ekstremt høje og lave tal og fokuserer på mellemstore frekvenser. Af denne grund præsenteres indkomstfordelingen i USA i mindre intervaller på $ 10.000 med indkomster, der er større end et vist tal, normalt en million, samlet sammen i et enkelt klasseinterval.
Brug dit skøn, når du beregner klasseinterval. Den hellige gral af en graf, såsom et histogram, er at formidle relevant information på en meningsfuld og enkel måde. Vælg dine klassevis for at videregive de oplysninger, du finder værd at være opmærksomme på.