Formel til beregning af sammenhæng
Korrelation er et statistisk mål mellem to variabler og defineres som ændring af størrelse i en variabel, der svarer til ændring i en anden, og den beregnes ved en summering af produktet af summen af den første variabel minus gennemsnittet af den første variabel til summen af den anden variabel minus gennemsnittet af anden variabel divideret med hele under rod af produkt af kvadrat af den første variabel minus gennemsnittet af den første variabel i summen af kvadratet af den anden variabel minus gennemsnittet af den anden variabel.
Værdien af korrelation er begrænset mellem -1 og +1 og kan fortolkes som følger:
- -1: Hvis det er -1, er variabler kendt som perfekt negativt korreleret. Det betyder, at hvis en variabel bevæger sig i den ene retning, bevæger en anden sig i den modsatte retning.
- 0: Det betyder, at variablen ikke har nogen sammenhæng.
- +1: Hvis det er +1, er variabler kendt som perfekt korreleret. Begge variabler bevæger sig i positive retninger.
Hvis vi har 2 variable x og y, kan korrelationskoefficienten mellem 2 variabler findes som:
Korrelationskoefficient = ∑ (x (i) - middelværdi (x)) * (y (i) -midlet (y)) / √ (∑ (x (i) -midlet (x)) 2 * ∑ (y (i) -middel (y)) 2 )
Hvor,
- x (i) = værdi af x i prøven
- Gennemsnit (x) = middelværdi af alle værdier af x
- y (i) = værdi af y i prøven
- Middelværdi (y) = middelværdi af alle værdier for y
Eksempler
Det er ubesværet at beregne sammenhængen i Excel. Syntaksen for den anvendte funktion er som følger:
Korrelationskoefficient = CORREL (array1, array2)
Eksempel nr. 1
Lad os tage det samme eksempel, som vi har taget ovenfor til beregning af korrelation ved hjælp af excel.
Løsning:
Nedenfor er værdierne x og y:

Beregningen er som følger.

Basis excel formel = CORREL (array (x), array (y))

Koefficient = +0,95
Da denne koefficient er tæt på +1, er x og y derfor meget positivt korreleret.
Eksempel 2
Korrelation er hovedsageligt nyttig til at analysere aktiekursen i virksomheder og skabe en aktieportefølje baseret på den.
Lad os finde ud af sammenhængen mellem Apple-aktier og Nasdaq-indekset på baggrund af det sidste års aktiepræstation. Apple er et USA-baseret multinationalt firma, der er specialiseret i it-produkter som iPod, iPad, Mac osv.
Løsning:
Nedenfor er det månedlige afkast af Apple og Nasdaq-aktier for det sidste år:

Lad os nu indtaste værdierne -
Korrelationskoefficient = ∑ (x (i) - middelværdi (x)). (Y (i) -måde (y)) / √ ∑ (x (i) -måde (x)) 2 ∑ (y (i) - betyder (y)) 2

Korrelation mellem Apple og Nasdaq = 0,039 / (√0,0039)

Koefficient = 0,62
Da korrelationen mellem Apple og Nasdaq er positiv, er Apple derfor positivt korreleret med Nasdaq.
Eksempel 3
Lad os nu se på sammenhængen mellem Walmart og Nasdaq-indekset baseret på det sidste et-års aktieudvikling. Walmart er et amerikansk-baseret firma, der har en detailkæde i supermarkeder.
Løsning:
Nedenfor er den månedlige præstation mellem Walmart og Nasdaq for det sidste år-

Lad os nu indtaste værdierne i formlen -
Korrelationskoefficient = ∑ (x (i) - middelværdi (x)). (Y (i) -måde (y)) / √ ∑ (x (i) -måde (x)) 2 ∑ (y (i) - betyder (y)) 2
Derfor er beregningen som følger,

Korrelation mellem Walmart og Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Koefficient = 0,12
Vi kan se, at Walmart og Nasdaq også er positivt korreleret, men ikke så meget sammenlignet med Apple-korrelation med Nasdaq.
Relevans og anvendelse
En korrelationskoefficient er nyttig til at etablere det lineære forhold mellem to variabler. Den måler, hvordan en variabel bevæger sig i forhold til bevægelsen af en anden variabel. Den praktiske anvendelse af denne koefficient er at finde ud af sammenhængen mellem aktiekursbevægelse og den samlede markedsbevægelse. Grundlaget for denne analyse, en aktieanalytiker, vil omfatte andelen af aktier for at skabe en optimal portefølje med minimal risiko. Det er også nyttigt i datalogi at finde ud af sammenhængen mellem 2 variabler.
Korrelationskoefficienten bruges også meget til at studere konstruktionsgyldigheden af data i faktoranalyse. Det bruges meget i regressionsanalyse til at forudsige værdierne for afhængige variabler baseret på forholdet mellem afhængige og uafhængige variabler. Denne ligning er ret nyttig i kvantitativ analyse for at få karakteren af forholdet mellem forskellige variabler. Grundlaget for dette forhold, hvis en variabel ikke er relateret til andre variabler, kan den fjernes fra listen.