Indhold
Bias er fejlen i estimater på grund af systematiske fejl, der fører til konstant høje eller lave resultater sammenlignet med de faktiske værdier. Den individuelle bias i et estimat, der vides at være partisk, er forskellen mellem de estimerede og faktiske værdier. Hvis det ikke vides at estimatet er partisk, kan forskellen også skyldes tilfældig fejl eller andre unøjagtigheder. I modsætning til bias, der altid fungerer i en retning, kan disse fejl være positive eller negative.
For at beregne bias af en metode, der er brugt til mange estimater, skal du finde fejlene ved at trække hvert estimat fra den faktiske eller observerede værdi. Tilføj alle fejlene, og divider med antallet af estimater for at få bias. Hvis fejlene tilføjes op til nul, var estimaterne uvildige, og metoden giver uvildige resultater. Hvis estimaterne er partiske, kan det være muligt at finde kilden til biasen og eliminere den for at forbedre metoden.
TL; DR (for lang; læste ikke)
Beregn bias ved at finde forskellen mellem et estimat og den faktiske værdi. For at finde en metias bias, skal du udføre mange estimater og tilføje fejlene i hvert estimat sammenlignet med den reelle værdi. Ved at dividere med antallet af estimater giver metoden bias. I statistikker kan der være mange estimater for at finde en enkelt værdi. Bias er forskellen mellem gennemsnittet af disse estimater og den faktiske værdi.
Sådan fungerer Bias
Når estimater er partiske, er de konsekvent forkerte i en retning på grund af fejl i det system, der bruges til estimaterne. For eksempel kan en vejrprognose konsekvent forudsige temperaturer, der er højere end dem, der faktisk er observeret. Prognosen er partisk, og et sted i systemet er der en fejl, der giver et for højt skøn. Hvis prognosemetoden er objektiv, kan den stadig forudsige temperaturer, der ikke er korrekte, men de forkerte temperaturer vil undertiden være højere og undertiden lavere end de observerede temperaturer.
Statistisk bias fungerer på samme måde, men er normalt baseret på et stort antal estimater, undersøgelser eller prognoser. Disse resultater kan grafisk repræsenteres i en distributionskurve, og bias er forskellen mellem gennemsnittet af fordelingen og den aktuelle værdi. Hvis der er bias, vil der altid være en forskel, selvom nogle individuelle estimater kan falde på begge sider af den aktuelle værdi.
Bias i undersøgelser
Et eksempel på bias er et undersøgelsesfirma, der afholder meningsmålinger under valgkampagner, men deres afstemningsresultater overvurderer konsekvent resultaterne for et politisk parti sammenlignet med de faktiske valgresultater. Bias kan beregnes for hvert valg ved at trække det faktiske resultat fra forudsigelsen af afstemningen. Den gennemsnitlige bias i den anvendte pollingmetode kan beregnes ved at finde gennemsnittet af de individuelle fejl. Hvis bias er stor og konsistent, kan pollingfirmaet prøve at finde ud af, hvorfor deres metode er partisk.
Bias kan komme fra to hovedkilder. Enten er udvælgelsen af deltagere til afstemningen partisk, eller forudindvindingen er resultatet af fortolkningen af de informationer, der er modtaget fra deltagerne. For eksempel er internetafstemninger i sig selv partisk, fordi de deltagere i afstemningen, der udfylder internetformularerne, ikke er repræsentative for hele befolkningen. Dette er en valg af bias.
Pollingfirmaer er opmærksomme på denne valg af bias og kompenserer ved at justere tallene. Hvis resultaterne stadig er partiske, er det en informationsbias, fordi virksomhederne ikke fortolker oplysningerne korrekt. I alle disse tilfælde viser en biasberegning, i hvilken udstrækning de estimerede værdier er nyttige, og hvornår metoderne skal justeres.