Korrelationsformel - Sådan beregnes? (Trin for trin)

Formel til beregning af sammenhæng

Korrelation er et statistisk mål mellem to variabler og defineres som ændring af størrelse i en variabel, der svarer til ændring i en anden, og den beregnes ved en summering af produktet af summen af ​​den første variabel minus gennemsnittet af den første variabel til summen af ​​den anden variabel minus gennemsnittet af anden variabel divideret med hele under rod af produkt af kvadrat af den første variabel minus gennemsnittet af den første variabel i summen af ​​kvadratet af den anden variabel minus gennemsnittet af den anden variabel.

Værdien af ​​korrelation er begrænset mellem -1 og +1 og kan fortolkes som følger:

  • -1: Hvis det er -1, er variabler kendt som perfekt negativt korreleret. Det betyder, at hvis en variabel bevæger sig i den ene retning, bevæger en anden sig i den modsatte retning.
  • 0: Det betyder, at variablen ikke har nogen sammenhæng.
  • +1: Hvis det er +1, er variabler kendt som perfekt korreleret. Begge variabler bevæger sig i positive retninger.

Hvis vi har 2 variable x og y, kan korrelationskoefficienten mellem 2 variabler findes som:

Korrelationskoefficient = ∑ (x (i) - middelværdi (x)) * (y (i) -midlet (y)) / √ (∑ (x (i) -midlet (x)) 2 * ∑ (y (i) -middel (y)) 2 )

Hvor,

  • x (i) = værdi af x i prøven
  • Gennemsnit (x) = middelværdi af alle værdier af x
  • y (i) = værdi af y i prøven
  • Middelværdi (y) = middelværdi af alle værdier for y

Eksempler

Det er ubesværet at beregne sammenhængen i Excel. Syntaksen for den anvendte funktion er som følger:

Korrelationskoefficient = CORREL (array1, array2)

Eksempel nr. 1

Lad os tage det samme eksempel, som vi har taget ovenfor til beregning af korrelation ved hjælp af excel.

Løsning:

Nedenfor er værdierne x og y:

Beregningen er som følger.

Basis excel formel = CORREL (array (x), array (y))

Koefficient = +0,95

Da denne koefficient er tæt på +1, er x og y derfor meget positivt korreleret.

Eksempel 2

Korrelation er hovedsageligt nyttig til at analysere aktiekursen i virksomheder og skabe en aktieportefølje baseret på den.

Lad os finde ud af sammenhængen mellem Apple-aktier og Nasdaq-indekset på baggrund af det sidste års aktiepræstation. Apple er et USA-baseret multinationalt firma, der er specialiseret i it-produkter som iPod, iPad, Mac osv.

Løsning:

Nedenfor er det månedlige afkast af Apple og Nasdaq-aktier for det sidste år:

Lad os nu indtaste værdierne -

Korrelationskoefficient = ∑ (x (i) - middelværdi (x)). (Y (i) -måde (y)) / √ ∑ (x (i) -måde (x)) 2 ∑ (y (i) - betyder (y)) 2

Korrelation mellem Apple og Nasdaq = 0,039 / (√0,0039)

Koefficient = 0,62

Da korrelationen mellem Apple og Nasdaq er positiv, er Apple derfor positivt korreleret med Nasdaq.

Eksempel 3

Lad os nu se på sammenhængen mellem Walmart og Nasdaq-indekset baseret på det sidste et-års aktieudvikling. Walmart er et amerikansk-baseret firma, der har en detailkæde i supermarkeder.

Løsning:

Nedenfor er den månedlige præstation mellem Walmart og Nasdaq for det sidste år-

Lad os nu indtaste værdierne i formlen -

Korrelationskoefficient = ∑ (x (i) - middelværdi (x)). (Y (i) -måde (y)) / √ ∑ (x (i) -måde (x)) 2 ∑ (y (i) - betyder (y)) 2

Derfor er beregningen som følger,

Korrelation mellem Walmart og Nasdaq = 0,0032 / (√0,0346 * 0,0219)

Koefficient = 0,12

Vi kan se, at Walmart og Nasdaq også er positivt korreleret, men ikke så meget sammenlignet med Apple-korrelation med Nasdaq.

Relevans og anvendelse

En korrelationskoefficient er nyttig til at etablere det lineære forhold mellem to variabler. Den måler, hvordan en variabel bevæger sig i forhold til bevægelsen af ​​en anden variabel. Den praktiske anvendelse af denne koefficient er at finde ud af sammenhængen mellem aktiekursbevægelse og den samlede markedsbevægelse. Grundlaget for denne analyse, en aktieanalytiker, vil omfatte andelen af ​​aktier for at skabe en optimal portefølje med minimal risiko. Det er også nyttigt i datalogi at finde ud af sammenhængen mellem 2 variabler.

Korrelationskoefficienten bruges også meget til at studere konstruktionsgyldigheden af ​​data i faktoranalyse. Det bruges meget i regressionsanalyse til at forudsige værdierne for afhængige variabler baseret på forholdet mellem afhængige og uafhængige variabler. Denne ligning er ret nyttig i kvantitativ analyse for at få karakteren af ​​forholdet mellem forskellige variabler. Grundlaget for dette forhold, hvis en variabel ikke er relateret til andre variabler, kan den fjernes fra listen.

Interessante artikler...