Hvad er Gaussisk distribution?

Posted on
Forfatter: Louise Ward
Oprettelsesdato: 11 Februar 2021
Opdateringsdato: 1 November 2024
Anonim
What is a Gaussian Distribution?
Video.: What is a Gaussian Distribution?

Indhold

I statistik bruges den Gaussiske eller normale distribution til at karakterisere komplekse systemer med mange faktorer. Som beskrevet i Stephen Stiglers Historie om statistikker, opfandt Abraham De Moivre distributionen, der bærer Karl Fredrick Gauss navn. Gauss 'bidrag lå i hans anvendelse af distributionen til den mindste firkantede tilgang til minimering af fejl i tilpasning af data med en linje, der passer bedst. Han gjorde det således til den vigtigste fejlfordeling i statistikker.


Motivering

Hvad er fordelingen af ​​en stikprøve af data? Hvad hvis du ikke kender dataens underliggende distribution? Er der nogen måde at teste hypoteser om dataene uden at kende den underliggende distribution? Takket være Central Limit Theorem er svaret ja.

Erklæring om sætning

Den angiver, at et eksempelmiddel fra en uendelig population er tilnærmelsesvis normalt eller gaussisk, med gennemsnit det samme som den underliggende population, og varians lig med populationsvariansen divideret med prøvestørrelsen. Tilnærmelsen forbedres, når prøvestørrelsen bliver stor.

Tilnærmelsesangivelsen er undertiden fejlagtigt som en konklusion om konvergens til en normal fordeling. Da den omtrentlige normalfordeling ændres, når prøvestørrelsen øges, er en sådan erklæring vildledende.

Sætningen blev udviklet af Pierre Simon Laplace.


Hvorfor det er overalt

Normale fordelinger er allestedsnærværende. Årsagen kommer fra Central Limit Theorem. Ofte, når en værdi måles, er det sumeffekten af ​​mange uafhængige variabler. Derfor har den værdi, der måles i sig selv, en prøve-middelkvalitet. For eksempel kan en fordeling af atletens præstationer have en klokkeform som et resultat af forskelle i diæt, træning, genetik, coaching og psykologi. Selv mændenes højder har en normal fordeling og er en funktion af mange biologiske faktorer.

Gaussiske kopuler

Det, der kaldes en "copula-funktion" med en Gauss-distribution, var i nyhederne i 2009 på grund af dets anvendelse i vurderingen af ​​risikoen for at investere i sikkerhedsstillede obligationer. Misbrug af funktionen var medvirkende til finanskrisen 2008-2009. Selvom der var mange årsager til krisen, burde Gauss-fordelinger i bageftersyn ikke have været anvendt. En funktion med en tykkere hale ville have tildelt større sandsynlighed for uønskede hændelser.


afledning

Den centrale grænse-teorem kan påvises i mange linjer ved at analysere den øjeblik genererende funktion (mgf) af (prøve middel - populationsmiddel) /? (Populationsvarians / prøve størrelse) som en funktion af mgf for den underliggende population. Tilnærmelsesdelen af ​​teoremmet introduceres ved at udvide den underliggende populations mgf som en magt-serie, hvorefter de fleste udtryk er ubetydelige, da prøvestørrelsen bliver stor.

Det kan bevises på langt færre linjer ved at bruge en Taylor-ekspansion på den karakteristiske ligning for den samme funktion og gøre prøvestørrelsen stor.

Computational Convenience

Nogle statistiske modeller antager, at fejlene er Gaussian. Dette gør det muligt at bruge fordelinger af funktioner af normale variabler, såsom chi-square- og F-distribution, til hypotese-test. I F-testen er F-statistikken specifikt sammensat af et forhold mellem chi-kvadratfordelinger, som i sig selv er funktioner i en normal variansparameter. Forholdet mellem de to får variansen til at annullere, hvilket muliggør hypotesetest uden kendskab til afvigelserne bortset fra deres normalitet og konstanthed.