Indhold
- Hurtig datavisualisering
- Visualisering af relativ overflod
- Komplekse datasæt kan være nødvendigt at klassificere i intervaller
- Frekvensborde kan skjule skev og kurtose
Frekvenstabeller kan være nyttige til at beskrive antallet af forekomster af en bestemt type nulpunkt i et datasæt. Frekvensborde, også kaldet frekvensfordelinger, er et af de mest basale værktøjer til visning af beskrivende statistik. Frekvenstabeller bruges bredt som et hurtigt overblik i distributionen af data; de er lette at fortolke, og de kan vise store datasæt på en ret kortfattet måde. Frekvenstabeller kan hjælpe med at identificere åbenlyse tendenser i et datasæt og kan bruges til at sammenligne data mellem datasæt af samme type. Frekvensborde er dog ikke passende til enhver applikation. De kan skjule ekstreme værdier (mere end X eller mindre end Y), og de egner sig ikke til analyser af dataets skævhed og kurtose.
Hurtig datavisualisering
Frekvensborde kan hurtigt afsløre outliers og endda betydelige tendenser inden for et datasæt med ikke meget mere end en kortvarig inspektion. For eksempel kan en lærer muligvis vise elevernes karakterer for en midtvejsperiode på en frekvenstabel for at få et hurtigt kig på, hvordan hendes klasse generelt klarer sig. Nummeret i frekvenssøjlen repræsenterer antallet af studerende, der modtager denne karakter; for en klasse på 25 studerende kan frekvensfordelingen af modtagne brevkarakterer se sådan ud: Gradfrekvens A .............. 7 B ........... ..13 C .............. 3 D .............. 2
Visualisering af relativ overflod
Frekvenstabeller kan hjælpe forskere med at undersøge den relative forekomst af hver enkelt måldata i deres prøve. Relativ overflod repræsenterer hvor meget af datasættet, der består af måldataene. Relativ overflod er ofte repræsenteret som et frekvenshistogram, men kan let vises i en frekvenstabel. Overvej den samme frekvensfordeling af midtvejsgrader. Relativ overflod er simpelthen procentdelen af de studerende, der har fået en bestemt karakter, og kan være nyttige til at konceptualisere data uden at overtænke dem. For eksempel med den tilføjede kolonne, der viser procentvis forekomst af hver karakter, kan du nemt se, at mere end halvdelen af klassen scorede en B, uden at skulle undersøge dataene i detaljer.
Kvalitetsfrekvens Relativ overflod (% frekvens) A .............. 7 .............. 28% B ......... .... 13 ............ 52% C .............. 3 ............. 12% D .............. 2 .............. 8%
Komplekse datasæt kan være nødvendigt at klassificere i intervaller
En ulempe er, at det er vanskeligt at forstå komplekse datasæt, der vises på en frekvenstabel. Store datasæt kan opdeles i intervalklasser for let visualisering ved hjælp af en frekvenstabel. Hvis du f.eks. Spurgte de næste 100 personer, du ser, hvad deres alder var, ville du sandsynligvis få en lang række svar, der spænder overalt fra tre til treoghalvfems. I stedet for at inkludere rækker for hver alder i din frekvenstabel, kan du klassificere dataene i intervaller, såsom 0 - 10 år, 11 - 20 år, 21 - 30 år og så videre. Dette kan også kaldes en grupperet frekvensfordeling.
Frekvensborde kan skjule skev og kurtose
Medmindre de vises på et histogram, kan skevhed og kurtose af data muligvis ikke ses i en frekvenstabel. Skævheden fortæller dig, hvilken retning dine data har tendens til. Hvis karakterer blev vist på tværs af X-aksen på en graf, der viser hyppigheden af midtvejs karakterer for vores 25 studerende ovenfor, ville fordelingen skeive mod As og Bs. Kurtosis fortæller dig om de centrale toppe i dine data - om de ville falde på linje med en normal fordeling, som er en dejlig glat klokkekurve, eller være høj og skarp. Hvis du tegner midtvejs karakterer i vores eksempel, vil du finde en høj top ved B med et skarpt dropoff i fordelingen af lavere kvaliteter.