Prøvefordeling - Definition, typer og eksempler

Hvad er en prøvetagningsfordeling?

En samplingsfordeling kan defineres som en sandsynlighedsfordeling ved hjælp af statistik ved først at vælge en bestemt population og derefter bruge tilfældige prøver, der er trukket fra populationen, dvs. den retter sig grundlæggende mod spredning af frekvenser relateret til spredning af forskellige resultater eller resultater, der muligvis kan finde sted for den bestemte valgte befolkning.

Forklaring

  • Mange forskere, akademikere, markedsstrateger osv. Går forud for distribution af stikprøver i stedet for at vælge hele befolkningen. Dette gør datasættet let og også håndterbart. For at gøre det lettere, formoder, at en marketingmedarbejder vil foretage en analyse af antallet af unge, der kører på cykel mellem to regioner inden for aldersgrænsen 13-18.
  • Til dette formål tager han ikke hensyn til hele befolkningen til stede i de to regioner mellem 13-18 år, hvilket praktisk talt ikke er muligt, og selv hvis det er gjort, er det for tidskrævende, og datasættet kan ikke håndteres . I stedet tager marketingmedarbejderen et prøvesæt på 200 hver fra hver region og får distribueringen gjort.
  • Den gennemsnitlige optælling af brugen af ​​cyklen her betegnes som middelprøven. Hver valgt prøve har sit eget genererede gennemsnit, og fordelingen udført for det gennemsnitlige opnåede gennemsnit defineres som prøvefordelingen. Den opnåede afvigelse betegnes som standardfejl.

Eksempel på prøvetagningsfordeling

  1. Antages det, at en forsker gennemfører en undersøgelse af vægten af ​​indbyggerne i en bestemt by, og at han har fem observationer eller prøver, dvs. 70 kg, 75 kg, 85 kg, 80 kg og 65 kg. Byen anses generelt for at have en normalfordeling og opretholder en standardafvigelse på 5 kg i forhold til vægtmål. Således kan gennemsnittet beregnes som (70 + 75 + 85 + 80 + 65) / 5 = 75 kg.
  2. Vi antager også, at befolkningsstørrelsen er enorm; for at gå til det andet trin dividerer vi således antallet af observationer eller prøver med 1, dvs. 1/5 = 0,20. Nu skal vi tage kvadratroden på 0,20, som kommer til 0,45. Kvadratroden ganges derefter med standardafvigelsen, dvs. 0,45 * 5 = 2,25 kg. Den opnåede standardfejl er således 2,25 kg, og den opnåede gennemsnit var 75 kg. Disse to faktorer kan bruges til at beskrive fordelingen.

Typer af prøveudtagningsfordeling

# 1 - Prøvefordeling af middelværdi

  • Dette kan defineres som den sandsynlige spredning af alle prøvemetoder, der er valgt tilfældigt med en fast størrelse fra en bestemt population. Når prøver har valgt en normal population, vil spredningen af ​​det opnåede gennemsnit også være normal i forhold til gennemsnittet og standardafvigelsen.
  • Hvis populationen ikke er normal til stille, vil fordelingen af ​​midlerne have en tendens til at blive tættere på normalfordelingen, forudsat at stikprøvestørrelsen er ret stor.

# 2 - Prøvefordeling af andel

Dette er primært forbundet med de statistikker, der er involveret i attributter. Her spiller rollen som binomial distribution. Generelt reagerer det på lovgivningen i binomialfordelingen, men når stikprøvestørrelsen stiger, bliver den normalt normalfordeling igen.

# 3 - Studerendes T-distribution

Denne type distribution anvendes, når standardafvigelsen for befolkningen er ukendt for forskeren, eller når størrelsen på prøven er meget lille. Denne type distribution er meget symmetrisk og opfylder betingelsen for standard normalvariat. Efterhånden som prøvestørrelsen stiger, har selv T-distribution tendens til at blive meget tæt på normalfordelingen.

# 4 - F-distribution

  • Når den større variation er obligatorisk til stede i tælleren, finder F-fordelingen sin anvendelse, da graden af ​​frihed ændrer de kritiske værdier for F-ændringer også, hvilket gælder for både store og små afvigelser. Dette kan beregnes ud fra de tilgængelige tabeller.
  • Sammenligningen foretages ud fra den målte værdi af F, der hører til prøvesættet, og værdien, der beregnes ud fra tabellen, hvis den tidligere er lig med eller større end tabelværdien, bliver nulhypotesen for undersøgelsen afvist.

# 5 - Chi-Square Formelfordeling

Denne type distribution bruges, når datasættet involverer at håndtere værdier, der inkluderer tilføjelse af firkanterne. Sættet med kvadratiske mængder, der hører til variansen af ​​prøver, tilføjes, og der oprettes således en fordelingsspredning, som vi kalder som chi-kvadratfordeling.

Betydning

  • Dette er vigtigt, fordi det forenkler vejen til statistisk slutning. Desuden tillader det, at analytiske overvejelser fokuseres på en statisk fordeling snarere end den blandede probabilistiske spredning af hver valgt prøveenhed.
  • Eliminering af variabilitet, der er til stede i statistikken, udføres ved hjælp af denne fordeling.
  • Det giver os et svar om de sandsynlige resultater, som mest sandsynligt vil ske.
  • De spiller en nøglerolle i inferentielle statistiske undersøgelser, hvilket betyder, at de spiller en vigtig rolle i slutningen af ​​hele befolkningen.

Konklusion

  • Dette er nøglen i statistik, fordi de fungerer som en vigtig retningslinje for statistisk slutning. De guider dybest set forskeren, akademikere eller statistikere om spredningen af ​​frekvenserne og signaliserer en række forskellige sandsynlige resultater, der kan mærkes yderligere til hele befolkningen.
  • Den primære faktor, der er involveret her, er gennemsnittet af prøven og standardfejlen, som, hvis estimater, hjælper os med at beregne prøveuddelingen også. Der findes forskellige typer distributionsteknikker, og baseret på scenariet og datasættet anvendes hver.

Interessante artikler...