Pearson korrelationskoefficient (formel, eksempel) - Beregn Pearson R

Pearson korrelationskoefficient definition

Pearson korrelationskoefficient, også kendt som Pearson R statistisk test, måler styrken mellem de forskellige variabler og deres forhold. Når der foretages en statistisk test mellem de to variabler, er det altid en god idé for den person, der foretager analyse, at beregne værdien af ​​korrelationskoefficienten for at vide, hvor stærkt forholdet mellem de to variabler er.

Pearsons korrelationskoefficient returnerer en værdi mellem -1 og 1. Fortolkningen af ​​korrelationskoefficienten er som under:

  • Hvis korrelationskoefficienten er -1, indikerer det et stærkt negativt forhold. Det indebærer et perfekt negativt forhold mellem variablerne.
  • Hvis korrelationskoefficienten er 0, indikerer det intet forhold.
  • Hvis korrelationskoefficienten er 1, indikerer det et stærkt positivt forhold. Det indebærer et perfekt positivt forhold mellem variablerne.

En højere absolut værdi af korrelationskoefficienten indikerer en stærkere sammenhæng mellem variabler. Således indikerer en korrelationskoefficient på 0,78 en stærkere positiv korrelation sammenlignet med en værdi på sige 0,36. Tilsvarende indikerer en korrelationskoefficient på -0,87 en stærkere negativ korrelation sammenlignet med en korrelationskoefficient på sige -0,40.

Med andre ord, hvis værdien er i det positive område, viser det, at forholdet mellem variabler er korreleret positivt, og begge værdier falder eller stiger sammen. På den anden side, hvis værdien er i det negative område, viser det, at forholdet mellem variabler er korreleret negativt, og begge værdier går i den modsatte retning.

Pearson korrelationskoefficientformel

Pearson's korrelationskoefficientformel er som følger,

Hvor,

  • r = Pearson-koefficient
  • n = antallet af bestandenes par
  • ∑xy = summen af ​​produkter af de parrede lagre
  • ∑x = summen af ​​x-score
  • ∑y = summen af ​​y-score
  • ∑x 2 = summen af ​​de kvadratiske x scorer
  • ∑y 2 = summen af ​​de kvadrerede y-scoringer

Forklaring

Trin 1: Find ud af antallet af variabler, som er betegnet med n. Lad os antage, at x består af 3 variabler - 6, 8, 10. Lad os antage, at y består af tilsvarende 3 variabler 12, 10, 20.

Trin 2: Skriv variablerne ned i to kolonner.

Trin 3: Find ud af produktet af x og y i 3 rd kolonnen.

Trin 4: Find summen af ​​værdier for alle x-variabler og alle y-variabler. Skriv resultaterne i bunden af 1 st og 2 nd kolonne. Skriv summen af x * y i 3 rd kolonnen.

Trin 5: Find ud af x 2 og y 2 i 4 th og 5 th kolonner og deres sum i bunden af søjlerne.

Trin 6: Indsæt de ovennævnte værdier i formlen, og løs den.

r = 3 * 352-24 * 42 / √ (3 * 200-24 2 ) * (3 * 644-42 2 )

= 0,7559

Eksempel på Pearson korrelationskoefficient R

Eksempel 1

I dette eksempel ved hjælp af følgende detaljer i tabellen over de 6 personer, der har en anden alder og forskellige vægte angivet nedenfor til beregning af værdien af ​​Pearson R

Sr nr Alder (x) Vægt (y)
1 40 78
2 21 70
3 25 60
4 31 55
5 38 80
6 47 66

Løsning:

Til beregning af Pearson-korrelationskoefficienten beregner vi først følgende værdier,

Her er det samlede antal personer 6, så n = 6

Nu er beregningen af ​​Pearson R som følger,

  • r = (n (∑xy) - (∑x) (∑y)) / (√ (n ∑x 2 - (∑x) 2 ) (n ∑y 2 - (∑y) 2 )
  • r = (6 * (13937) - (202) (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (6 * (13937) - (202) * (409)) / (√ (6 * 7280 - (202) 2 ) * (6 * 28365- (409) 2 )
  • r = (83622- 82618) / (√ (43680-40804) * (170190- 167281)
  • r = 1004 / (√ (2876) * (2909)
  • r = 1004 / (√ 8366284)
  • r = 1004 / 2892.452938
  • r = 0,35

Således er værdien af ​​Pearson-korrelationskoefficienten 0,35

Eksempel 2

Der er 2 aktier - A og B. Deres aktiekurser på bestemte dage er som følger:

Lager A (x) Stcok B (y)
45 9
50 8
53 8
58 7
60 5

Find ud af Pearson-korrelationskoefficienten ud fra ovenstående data.

Løsning:

Først beregner vi følgende værdier.

Beregningen af ​​Pearson-koefficienten er som følger,

  • r = (5 * 1935-266 * 37) / ((5 * 14298- (266) 2) * (5 * 283- (37) 2)) 0,5
  • = -0,9088

Derfor er Pearson-korrelationskoefficienten mellem de to lagre -0,9088.

Fordele

  • Det hjælper med at vide, hvor stærkt forholdet mellem de to variabler er. Ikke kun tilstedeværelsen eller fraværet af korrelationen mellem de to variabler er angivet ved hjælp af Pearson-korrelationskoefficienten, men det bestemmer også det nøjagtige omfang, i hvilket disse variabler er korreleret.
  • Ved hjælp af denne metode kan man fastslå korrelationsretningen, dvs. om korrelationen mellem to variabler er negativ eller positiv.

Ulemper

  • Pearson-korrelationskoefficienten R er ikke tilstrækkelig til at fortælle forskellen mellem de afhængige variabler og de uafhængige variabler, da korrelationskoefficienten mellem variablerne er symmetrisk. For eksempel, hvis en person forsøger at kende sammenhængen mellem højt stress og blodtryk, kan man måske finde den høje værdi af korrelationen, hvilket viser, at højt stress forårsager blodtrykket. Hvis variablen nu skiftes rundt, vil resultatet i så fald også være det samme, hvilket viser, at stress er forårsaget af blodtrykket, hvilket ikke giver mening. Derfor skal forskeren være opmærksom på de data, som han bruger til at gennemføre analysen.
  • Ved hjælp af denne metode kan man ikke få oplysningerne om linjens hældning, da det kun angiver, om der er et forhold mellem de to variabler eller ej.
  • Det er sandsynligt, at Pearson-korrelationskoefficienten kan fejlagtigt fortolkes, især i tilfælde af homogene data.
  • Sammenlignet med de andre beregningsmetoder tager denne metode meget tid at nå frem til resultaterne.

Vigtige punkter

  • Værdierne kan variere fra værdien +1 til værdien -1, hvor +1 angiver det perfekte positive forhold mellem de betragtede variabler, -1 angiver det perfekte negative forhold mellem de betragtede variabler, og en værdi 0 angiver, at der ikke er noget forhold findes mellem de betragtede variabler.
  • Det er uafhængigt af variablenes måleenhed. For eksempel, hvis måleenheden for en variabel er i år, mens måleenheden for den anden variabel er i kg, selv da, ændres værdien af ​​denne koefficient ikke.
  • Korrelationskoefficienten mellem variablerne er symmetrisk, hvilket betyder, at værdien af ​​korrelationskoefficienten mellem Y og X eller X og Y forbliver den samme.

Konklusion

Pearson korrelationskoefficient er den type korrelationskoefficient, der repræsenterer forholdet mellem de to variabler, som måles på det samme interval eller samme forholdsskala. Det måler styrken af ​​forholdet mellem de to kontinuerlige variabler.

Det angiver ikke kun tilstedeværelsen eller fraværet af korrelationen mellem de to variabler, men det bestemmer også det nøjagtige omfang, i hvilket disse variabler er korreleret. Det er uafhængigt af måleenheden for variablerne, hvor værdierne for korrelationskoefficienten kan variere fra værdien +1 til værdien -1. Det er imidlertid ikke tilstrækkeligt at fortælle forskellen mellem de afhængige variabler og de uafhængige variabler.

Interessante artikler...