Hvad er huller, klynger og outliers i matematik?

Posted on
Forfatter: Louise Ward
Oprettelsesdato: 11 Februar 2021
Opdateringsdato: 19 November 2024
Anonim
En baby Megalodon bevæger sig frit i havet. ❤  - Megalodon GamePlay 🎮📱 VR
Video.: En baby Megalodon bevæger sig frit i havet. ❤ - Megalodon GamePlay 🎮📱 VR

Indhold

Forretnings-, regerings- og akademiske aktiviteter kræver næsten altid indsamling og analyse af data. En af måderne til at repræsentere numeriske data er gennem grafer, histogrammer og diagrammer. Disse visualiseringsteknikker giver folk mulighed for at få bedre indsigt i problemer og udtænke løsninger. Huller, klynger og outliers er karakteristika ved datasæt, der påvirker matematisk analyse og er let synlige på visuelle repræsentationer.


Huller i dataene

Huller henviser til manglende områder i et datasæt. For eksempel, hvis et videnskabeligt eksperiment indsamler temperaturdata i intervallet 50 grader Fahrenheit til 100 grader Fahrenheit, men intet mellem 70 og 80 grader, ville det repræsentere et hul i datasættet. Et linie plot af dette datasæt ville have "x" -mærker for temperaturer mellem 50 og 70 og igen mellem 80 og 100, men der ville ikke være noget mellem 70 og 80. Forskere kan grave dybere og undersøge, hvorfor visse datapunkter ikke dukker op i en samlet prøve.

Isolerede grupper

Klynger er isolerede grupper af datapunkter. Linjeplaner, som er en af ​​måderne til at repræsentere datasæt, er linjer med "x" -mærker placeret over specifikke numre for at skildre deres hyppighed af forekomst i datasættet. En klynge er afbildet som en samling af disse "x" -mærker i et lille interval eller datasubsæt. Hvis eksamensresultaterne for en klasse på 10 studerende for eksempel er 74, 75, 80, 72, 74, 75, 76, 86, 88 og 73, ville de mest "x" -mærker på en linjeplads være i 72- score-til-76-scoreinterval. Dette ville repræsentere en dataklynge. Bemærk, at frekvensen for 74 og 75 er to, men for alle andre scoringer er den én.


Ved ekstreme ting

Outliers er ekstreme værdier - datapunkter, der ligger markant uden for andre værdier i et datasæt. En outlier skal være markant mindre end eller større end flertallet af numre i et datasæt. Definitionen af ​​"ekstrem" afhænger af omstændighederne og en enighed af de analytikere, der er involveret i forskningen. Outliers kan være dårlige datapunkter, også kendt som støj, eller de kan indeholde værdifulde oplysninger om det fænomen, der undersøges, og selve dataindsamlingsmetoden. For eksempel, hvis klassescore for det meste ligger i området 70 til 80, men et par scoringer er i de lave 50'ere, repræsenterer disse muligvis outliers.

Samler det hele

Huller, outliers og klynger i datasæt kan påvirke resultaterne af matematisk analyse. Huller og klynger kan repræsentere fejl i metoden til dataindsamling. For eksempel, hvis en telefonundersøgelse kun afstemmer bestemte områdekoder, såsom boligkomplekser med lav indkomst eller high-end forstadsboliger og ikke et bredt tværsnit af befolkningen, er chancerne for, at der er huller og klynger i dataene . Outliers kan skjule middel- eller gennemsnitsværdien af ​​et datasæt. For eksempel er middelværdien eller gennemsnitsværdien af ​​et datasæt bestående af fire numre - 50, 55, 65 og 90 - 65. Uden outlier 90 er gennemsnittet imidlertid ca. 57.