Gennemsnit vs Median - Forskelle mellem metoder anvendt i statistik

Forskellen mellem middel og median

Middelværdi og median er to almindeligt anvendte udtryk i matematik, middelværdi er som gennemsnittet af et givet tal, og det opsummerer tallene og deler dem med antallet af tal, som giver os gennemsnittet, mens medianen på den anden side returnerer det midterste tal fra det samlede datasæt, og hvis datasættet er lige, tilføjer median de to midterste tal og deler det med 2, hvilket giver os medianen.

De er målestokken for den centrale tendens og bruges ofte til måling af store datasæt, hvor analyser skal tegnes, og resultater fortolkes. Gennemsnit, median og tilstand er tre mål for gennemsnit, der viser spredningen af ​​dataene er fra middelværdien eller gennemsnittet. Disse metoder bruges bredt i statistikker, mens gennemsnitsværdien af ​​data er den mest anvendte metode blandt de tre.

Hvad betyder det?

Gennemsnit er en simpel sum af antallet af observationer i en matrix, der divideres med antallet af observationer. For eksempel, hvis vi taler om gennemsnitshøjden eller gennemsnitshøjden for en gruppe bestående af 5 personer. Den gennemsnitlige højde beregnes ved at summere højden på 5 personer divideret med antallet af personer, dvs. 5.

Formel

Middelformel = (Summen af ​​alle observationer / antal observationer)

Hvad er medianen?

Median er derimod det midterste tal i datasættets sæt, som adskiller det højere datasæt fra det nedre. Dataene skal arrangeres i stigende rækkefølge først for at beregne medianen af ​​dataene. Når datasættet har kardinalitet, skal gennemsnittet af de midterste to tal i datasættet tages. Disse to metoder bruges dog ofte om hverandre.

Formel

Medianformel = (n + 1) / 2

når n er et ulige tal

Median = ((n / 2) + ((n / 2) +1)) / 2

når n er et lige tal

Middel vs median infografik

Lad os se de største forskelle mellem gennemsnit vs median.

Middel vs median nøgleforskelle

  • Middelværdien er enkel at bruge og anvende og kan anvendes på ethvert datasæt, hvad enten det er lige eller ulige. Median er derimod en smule kompleks at bruge, og datasættet skal arrangeres i stigende eller faldende rækkefølge før beregning.
  • Gennemsnittet bruges normalt til normale fordelinger, mens medianen bruges til det skævte fordelingsdatasæt.
  • Gennemsnittet er simpelt, men det er ikke robust, for det kan indeholde afvigelser i distributionerne og kan undertiden ikke give brugeren de korrekte resultater til fortolkning. På den anden side er medianmetoden robust og er bedre egnet til at bruge til, da den bruges til skæv fordelinger for at udlede den centrale tendens i datasættet og vil give brugeren mange nøjagtige resultater sammenlignet med gennemsnit
  • Der er kun en formel for middelværdien, der er summen af ​​alle observationer divideret med antallet af observationer. Mens medianen har to formler, en af ​​de ulige, hvor bare de midterste tal fra datasættet bliver medianen. Men når vi har et jævnt datasæt, vælges midten af ​​de to værdier og deles med 2, hvilket derefter giver os medianen for det jævne datasæt.

Gennemsnitlig sammenligningstabel mod median

Betyde Median
Gennemsnittet beregnes ved at sammenlægge alle værdierne i dataarrayet, som derefter divideres med antallet af observationer. Median er den nøjagtige middelværdi af datasættet. Det kan beregnes ved at arrangere datasættet i stigende rækkefølge og derefter finde eller udvælge middelværdien fra datasættet.
Det er mere udbredt i branchen på grund af en nem beregning af gennemsnittet, og det giver os et hurtigt tal. Det bruges ikke ofte i branchen, men det er mere komplet og nøjagtigt end middelværdien, hvilket kun er en simpel sum af tal.
Det bruges generelt til normalt skævt datasæt, dvs. normalfordeling. Det er især praktisk at beskrive datasættet med en betydelig skævhed i dataene, eller når dataene har en lang hale. Det bruges bredt, hvor konturerne har betydelig vægt i de data, der betyder, at det ikke er en god beregningsmetode.
Det er ikke et robust værktøj til beregning for at udlede den centrale tendens. Det er et meget robust værktøj, da det bestemmer vægten i dataene, som generelt har høj vægt ved længere haler.
Det er meget følsomt over for outliers. Det er meget mindre påvirket af outliers.
Det er nemt at bruge Det er komplekst.
Det kan ikke beregnes for kategoriske data, da værdierne ikke kan summeres. Det kan ikke identificeres for kategoriserede nominelle data, da de ikke kan bestilles logisk.

Konklusion

Bortset fra middelværdien og medianen er der endnu en metode, der ofte bruges til at måle central tendens, som er tilstanden. En tilstand er en værdi, der oftest forekommer i datasættet; tilstanden har en fordel i forhold til middelværdien og medianen, at den kan findes for både numeriske og kategoriserede datasæt.

På trods af eksistensen af ​​mode og median overlegenhed af bedre resultater og analyse i forhold til gennemsnittet, er middelværdien stadig det mest passende mål for central tendens, især hvis datasættet er en normalfordeling, og dataene er normalt skæv.

Som en god analytiker skal den centrale tendens måles med alle tre datametoder, og variansen i analysen skal overvejes og omhyggeligt analyseres for at give bedre og mere nøjagtige resultater i datasættet.

Interessante artikler...