Sådan finder du korrelationskoefficienten for 'R' i et spredningsdiagram

November 2024

Forfatter: Laura McKinney

Oprettelsesdato: 9 April 2021

Opdateringsdato: 17 November 2024

Sådan finder du korrelationskoefficienten for 'R' i et spredningsdiagram - Videnskab

Indhold

TL; DR (for lang; læste ikke)

At finde styrken i forbindelsen mellem to variabler er en vigtig færdighed for forskere af alle typer. Hvis to variabler er korrelerede med hinanden, viser det, at der er en forbindelse mellem dem. En positiv korrelation betyder, at når den ene variabel stiger, den anden gør det også, og en negativ korrelation betyder, at når den ene variabel stiger, falder den anden. Korrelationer beviser ikke årsagssammenhæng, selvom det er muligt, at yderligere test vil bevise et årsagsforhold mellem variablerne. Korrelationskoefficient R viser styrken i forholdet mellem de to variabler, og om det er en positiv eller negativ korrelation.

TL; DR (for lang; læste ikke)

Ring til en variabel x og en variabel y. Beregn værdien af R ved hjælp af formlen:

R = ÷ √ {}

Hvor n er din prøve størrelse.

Lav en tabel over dine data. Dette skal omfatte en kolonne for deltagernummeret, en kolonne for den første variabel (mærket x) og en kolonne for den anden variabel (mærket y). Hvis du for eksempel ser for at se, om der er en sammenhæng mellem højde og skostørrelse, vil en kolonne identificere hver person, du måler, en kolonne viser hver persons højde og en anden viser deres skostørrelse. Lav yderligere tre kolonner, en til xy, en til x² og en til y².

Brug dine data til at udfylde de tre yderligere kolonner. Forestil dig for eksempel, at din første person måler 75 tommer høj og har størrelse 12 fod. Det x (højde) kolonne viser 75, og y (skostørrelse) kolonne viser 12. Du skal finde xy, x² og y². Så ved at bruge dette eksempel:

xy = 75 × 12 = 900

x² = 75² = 5,625

y² = 12² = 144

Udfør disse beregninger for hver person, du har data til.

Opret en ny række i bunden af din tabel for summen af hver kolonne. Tilføj alle sammen x værdier, alle y værdier, alle xy værdier, alle x² værdier og alle y² værdier, og sæt derefter resultaterne nederst i den tilsvarende kolonne i din nye række. Du kan markere din nye række “sum” eller bruge et sigma-symbol (Σ).

Du finder R fra dine data ved hjælp af formlen:

R = ÷ √ {}

Dette ser lidt skræmmende ud, så du kan opdele det i to dele, som vi kalder s og t.

s = n (Σxy) - (Σx) (Σy)

t = √ {}

I disse ligninger n er antallet af deltagere, du har (din prøvestørrelse). Resten af ligningens dele er de summer, du har beregnet i det sidste trin. Så for smultiplicer størrelsen på din prøve med summen af xy kolonne, og træk derefter summen af x kolonne ganget med summen af y kolonne fra dette.

Til t, der er fire hovedtrin. Beregn først n ganget med summen af din x² kolonne, og træk derefter summen af din x kolonne i kvadrat (ganget med sig selv) fra denne værdi. For det andet skal du gøre nøjagtigt den samme ting, men med summen af y² kolonne og summen af y søjle kvadreret i stedet for x dele (dvs. n × Σy² -). For det tredje skal du multiplicere disse to resultater (for xs og ys) sammen. For det fjerde, tag kvadratroten af dette svar.

Hvis du har arbejdet i dele, kan du beregne R så enkelt R = s ÷ t. Du får et svar mellem −1 og 1. Et positivt svar viser en positiv sammenhæng, hvor alt over 0,7 generelt betragtes som et stærkt forhold. Et negativt svar viser en negativ sammenhæng, hvor alt over -0,7 betragtes som et stærkt negativt forhold. Tilsvarende betragtes ± 0,5 som et moderat forhold, og ± 0,3 betragtes som et svagt forhold. Alt tæt på 0 viser en mangel på sammenhæng.