Sådan beregnes betydning

November 2024

Forfatter: Robert Simon

Oprettelsesdato: 24 Juni 2021

Opdateringsdato: 15 November 2024

Indhold

Type I-fejl: Forkert afvisning af nulhypotesen
Type II-fejl: Forkert afvisning af den alternative hypotese
Bestemmelse af betydningsniveauet
Valg af en signifikansetest

Statistisk betydning er en objektiv indikator for, hvorvidt resultaterne af en undersøgelse er matematisk "reelle" og statistisk forsvarbare, snarere end kun en chance. Almindeligt anvendte signifikansetests ser for forskelle i middel til datasæt eller forskelle i datasætets variationer. Den type test, der anvendes, afhænger af den type data, der analyseres. Det er op til forskerne at bestemme, hvor betydningsfulde de kræver, at resultaterne skal være - med andre ord, hvor stor risiko de er villige til at tage for at være forkert. Forskere er typisk villige til at acceptere et risikoniveau på 5 procent.

Type I-fejl: Forkert afvisning af nulhypotesen

••• Scott Rothstein / iStock / Getty Images

Eksperimenter udføres for at afprøve specifikke hypoteser eller eksperimentelle spørgsmål med et forventet resultat. En nulhypotese er en, der ikke registrerer nogen forskel mellem de to datasæt, der sammenlignes. I en medicinsk undersøgelse kan for eksempel nulhypotesen være, at der ikke er nogen forskel i forbedring mellem patienter, der får undersøgelsesmedicinen, og patienter, der får placebo. Hvis forskeren forkert afviser denne nulhypotese, når den faktisk er sand, med andre ord, hvis de "opdager" en forskel mellem de to sæt patienter, når der virkelig ikke var nogen forskel, har de begået en type I-fejl.Forskere bestemmer forud for, hvor stor risiko for at begå en type I-fejl, de er villige til at acceptere. Denne risiko er baseret på en maksimal p-værdi, som de vil acceptere, før de afviser nulhypotesen, og kaldes alfa.

Type II-fejl: Forkert afvisning af den alternative hypotese

En alternativ hypotese er en, der registrerer en forskel mellem de to datasæt, der sammenlignes. I tilfælde af den medicinske prøve, ville du forvente at se forskellige niveauer af forbedringer hos patienter, der får undersøgelsesmedicinen, og patienter, der fik placebo. Hvis forskere ikke klarer at afvise nulhypotesen, når de skulle, med andre ord, hvis de "opdager" ingen forskel mellem de to patienter, når der virkelig var en forskel, har de begået en type II-fejl.

Bestemmelse af betydningsniveauet

Når forskere udfører en test med statistisk signifikans, og den resulterende p-værdi er mindre end risikoniveauet, der anses for acceptabelt, betragtes testresultatet som statistisk signifikant. I dette tilfælde afvises nulhypotesen - hypotesen om, at der ikke er nogen forskel mellem de to grupper. Med andre ord indikerer resultaterne, at der er en forskel i forbedring mellem patienter, der modtager undersøgelsesmedicinen, og patienter, der får placebo.

Valg af en signifikansetest

Der er flere forskellige statistiske test at vælge imellem. En standard t-test sammenligner midlerne fra to datasæt, såsom vores undersøgelsesmedicinske data og vores placebo-data. En parret t-test bruges til at detektere forskelle i det samme datasæt, såsom en før-og-efter undersøgelse. En envejsanalyse af variation (ANOVA) kan sammenligne midlerne fra tre eller flere datasæt, og en tovejs ANOVA sammenligner midlerne til to eller flere datasæt som svar på to forskellige uafhængige variabler, såsom forskellige styrker af studere lægemiddel. En lineær regression sammenligner middelene til datasættene langs en gradient af behandlinger eller tid. Hver statistiske test resulterer i målinger af betydning eller alfa, der kan bruges til at fortolke testresultaterne.