Hvad er korrelationskoefficienten?
Korrelationskoefficient bruges til at bestemme, hvor stærkt forholdet mellem to variabler er, og dets værdier kan variere fra -1,0 til 1,0, hvor -1,0 repræsenterer negativ korrelation og +1,0 repræsenterer et positivt forhold. Den overvejer de relative bevægelser i variablerne og definerer derefter, om der er noget forhold mellem dem.
Formel for korrelationskoefficient
r = n (∑xy) - ∑x ∑y / √ (n * (∑x 2 - (∑x) 2 )) * (n * (∑y 2 - (∑y) 2 ))
Hvor
- r = korrelationskoefficient
- n = antal observationer
- x = 1 st variabel i forbindelse
- y = 2. variabel
Forklaring
Hvis der er nogen sammenhæng eller siger forholdet mellem to variabler, skal det indikere, at hvis en af variablerne ændrer sig i værdi, vil den anden variabel også have tendens til at ændre sig i værdi, f.eks. I specifik, som enten kan være i den samme eller i den modsatte retning. Tællerdelen af ligningen udfører en test og relativ styrke af de variabler, der bevæger sig sammen, og nævnningsdelen af ligningen skalerer tælleren ved at multiplicere forskellene mellem variablerne fra kvadratiske variabler.
Eksempler
Eksempel nr. 1
Overvej følgende to variabler, x og y, du skal beregne korrelationskoefficienten.
Nedenfor gives data til beregningen.

Løsning:
Ved hjælp af ovenstående ligning kan vi beregne følgende

Vi har alle værdierne i ovenstående tabel med n = 4.
Lad os nu indtaste værdierne til beregning af korrelationskoefficienten.

Derfor er beregningen som følger,

r = (4 * 25,032,24) - (262,55 * 317,31) / √ ((4 * 20,855,74) - (262,55) 2 ) * ((4 * 30,058,55) - (317,31) 2 )
r = 16,820,21 / 16,831,57
Koefficienten vil være -

Koefficient = 0,99932640
Eksempel 2
Land X er et land i vækstøkonomi, og det ønsker at foretage en uafhængig analyse af de beslutninger, som centralbanken træffer vedrørende renteforandringer, uanset om de har påvirket inflationen og har centralbanken mulighed for at kontrollere det samme.
I det følgende gives en oversigt over renten og den inflation, der hersker i landet i gennemsnit for disse år.
Nedenfor gives data til beregningen.

Landets præsident har henvendt sig til dig for at foretage en analyse og give en præsentation om det samme på det næste møde. Brug korrelation og fastlægg, om centralbanken har nået sit mål eller ej.
Løsning:
Ved hjælp af formlen beskrevet ovenfor kan vi beregne korrelationskoefficienten. Behandling af renten som en variabel, f.eks. X, og behandling af inflationen som en anden variabel som y.

Vi har alle værdierne i ovenstående tabel med n = 6.
Lad os nu indtaste værdierne til beregning af korrelationskoefficienten.


r = (6 * 170,91) - (46,35 * 22,24) / √ ((6 * 361,19) - (46,35) 2 ) * ((6 * 82,74) - (22,24) 2 )
r = -5,36 / 5,88
Korrelationen vil være -

Korrelation = -0,92
Analyse: Det ser ud til, at sammenhængen mellem renten og inflationen er negativ, hvilket synes at være det rigtige forhold. Når renten stiger, falder inflationen, hvilket betyder, at de har tendens til at bevæge sig i den modsatte retning fra hinanden, og det fremgår af ovenstående resultat, at centralbanken havde succes med at gennemføre beslutningen om rentepolitik.
Eksempel 3
ABC-laboratorium forsker i højde og alder og ønskede at vide, om der er noget forhold mellem dem. De har samlet en prøve på 1000 personer til hver af kategorierne og kom op med en gennemsnitlig højde i den gruppe.
Nedenfor gives data til beregning af korrelationskoefficienten.

Du skal beregne korrelationskoefficienten og komme med den konklusion, at hvis der findes et forhold.
Løsning:
Behandling af alder som en variabel, siger x, og behandling af højde (i cms) som en anden variabel som y.

Vi har alle værdierne i ovenstående tabel med n = 6.
Lad os nu indtaste værdierne til beregning af korrelationskoefficienten.


r = (6 * 10.137) - (70 * 850) / √ ((6 * 940 - (70) 2 ) * ((6 * 1.20.834) - (850) 2 )
r = 1.322,00 / 1.361,23
Korrelationen vil være -

Korrelation = 0,971177099
Relevans og anvendelse
Det bruges i statistikker hovedsageligt til at analysere styrken af forholdet mellem de variabler, der er under overvejelse, og det måler også, om der er nogen lineær sammenhæng mellem de givne datasæt, og hvor godt de kan relateres. Et af de almindelige målinger, der bruges i korrelation, er Pearson Correlation Coefficient.
Hvis en variabel ændrer sig i værdi og sammen med den anden variabel ændrer sig i værdi, er forståelse af forholdet kritisk, da man kan bruge værdien af den tidligere variabel til at forudsige ændringen i værdien af den sidstnævnte variabel. En sammenhæng har mange forskellige anvendelser i dag i denne moderne æra, som den bruges i den finansielle industri, videnskabelig forskning, og hvor ikke. Men det er dog vigtigt at vide, at korrelation har tre hovedtyper af forhold. Den første er et positivt forhold, der angiver, at hvis der er en ændring i værdien af en variabel, så vil der være en ændring i den relaterede variabel i samme retning. Tilsvarende, hvis der er et negativt forhold, vil den relaterede variabel opføre sig i den modsatte retning. Også, hvis der ikke er nogen sammenhæng, vil r antyde en nulværdi.Se nedenstående billeder for bedre at forstå konceptet.
