Skævhed - betydning, typer og eksempler

Indholdsfortegnelse

Skævhed Betydning

Skævhed Betydning

Skævhed beskriver, hvor meget statistisk datadistribution er asymmetrisk fra normalfordelingen, hvor fordelingen er ligeligt opdelt på hver side. Hvis en distribution ikke er symmetrisk eller normal, er den skæv, dvs. den er enten frekvensfordelingen skævt til venstre eller til højre side.

Typer af skevhed

Hvis fordelingen er symmetrisk, har den en skævhed på 0 og dens middelværdi = median = tilstand.

Så grundlæggende er der to typer -

Positiv : Fordelingen er positivt skæv, når det meste af fordelingsfrekvensen ligger på højre side af distributionen og har en længere og federe højre hale. Hvor distributionens middelværdi> median> tilstand.
Negativ : Fordelingen er negativt skæv, når det meste af fordelingsfrekvensen ligger på venstre side af distributionen og har en længere og federe venstre hale. Hvor distributionens gennemsnitlige <median <-tilstand.

Formel

Skævhedsformel er repræsenteret som nedenfor -

Der er flere måder at beregne skævheden af datadistributionen på. Den ene er Pearsons første og anden koefficient.

Pearsons første koefficienter (Mode Skewness): Den er baseret på den gennemsnitlige, tilstand & standardafvigelse af fordelingen.

Formel: (middel - tilstand) / standardafvigelse.

Pearsons anden koefficienter (median skævhed): Den er baseret på distributionens gennemsnitlige, median og standardafvigelse.

Formel: (middel - median) / standardafvigelse.

Som du kan se ovenfor, har Pearson's første skævhedskoefficient en tilstand som sin ene variabel til at beregne den, og den er kun nyttig, når data har et mere gentagne tal i datasættet, som om der kun er få gentagne data i dataene sæt, der hører til mode, så er Pearsons anden skævhedskoefficient et mere pålideligt mål for central tendens, da det betragter medianen af datasættet i stedet for tilstand.

For eksempel:

Datasæt (a): 7,8,9,4,5,6,1,2,2,3.

Datasæt (b): 7,8,4,5,6,1,2,2,2,2,2,2,2,2,2,2,3.

For begge datasættene kan vi konkludere, at tilstanden er 2. Men det giver ikke mening at bruge Pearsons første skævhedskoefficient til datasæt (a), da nummer 2 kun vises to gange i datasættet, men det kan bruges at skabe datasæt (b), da det har en mere gentagen tilstand.

En anden måde at beregne skævhed ved hjælp af nedenstående formel:

= Tilfældig variabel.
X = fordeling middel.
N = Total variabel i fordelingen.
α = Standardafvigelse.

Eksempel på skevhed

For at forstå dette koncept mere detaljeret, lad os se på nedenstående eksempel:

I XYZ management college overvejer 30 sidsteårsstuderende jobplacering i QPR-forskningsfirmaet, og deres kompensation er baseret på studerendes akademiske præstationer og tidligere erhvervserfaring. Nedenfor er data om den studerendes kompensation i PQR-forskningsfirmaet.

Løsning

Brug nedenstående data

Beregning af fordelingsgennemsnit

= ($ 400 * 12 + $ 500 * 8 + $ 700 * 5 + $ 850 * 3 + $ 1000 * 2) / 30
Fordeling middel = 561,67

Beregning af standardafvigelse

Standardafvigelse = √ ((Summen af afvigelsesfeltet * Antal studerende) / N).
Standardafvigelse = 189,16

Beregning af skævhed kan gøres som følger -

Skævhed: (summen af Deviation Cube) / (N-1) * Standardafvigelsens Cube.
= (106374650.07) / (29 * 6768161.24)
= 0,54

Derfor fortæller værdien på 0,54 os, at distributionsdata er lidt skæv fra normalfordelingen.

Fordele

Skævhed er bedre at måle effektiviteten af investeringsafkastet.
Investoren bruger dette, når han analyserer datasættet, da det betragter fordelingen yderst i stedet for kun at stole på
Det er et meget anvendt værktøj i statistikken, da det hjælper med at forstå, hvor meget data der er asymmetri fra normalfordelingen.

Ulemper

Skævhed spænder fra negativ uendelighed til positiv uendelighed, og det bliver undertiden svært for en investor at forudsige tendensen i datasættet.
En analytiker forudsiger et aktivs fremtidige ydeevne ved hjælp af den økonomiske model, som normalt antager, at data normalt distribueres, men hvis distributionen af data er skæv, vil denne model ikke afspejle det faktiske resultat i sin antagelse.

Betydning

I statistik spiller det en vigtig rolle, når distributionsdata ikke normalt distribueres. De ekstreme datapunkter i datasættet kan føre til, at datadistribution skæv mod venstre (dvs. ekstreme data i datasættet er mindre, det skæve datasæt er negativt, hvilket resulterer i mode). Det hjælper en investor, der har en kortvarig tilbageholdelsesperiode, til at analysere dataene for at identificere den tendens, der falder i den yderste ende af distributionen.

Konklusion

Skævhed er simpelthen, hvor meget datasæt, der afviger fra dets normale fordeling. En større negativ værdi i datasættet betyder, at distribution er negativt skæv og større positiv værdi i datasættet betyder, at distribution er positivt fordelt. Det er et godt statistisk mål, der hjælper investoren med at forudsige afkast fra distributionen.