Hypergeometrisk fordeling (definition, formel) - Sådan beregnes?

Definition af hypergeometrisk distribution

I statistikken og sandsynlighedsteorien er hypergeometrisk fordeling grundlæggende en særskilt sandsynlighedsfordeling, der definerer sandsynligheden for k-succeser (dvs. nogle tilfældige tegninger for det objekt, der er tegnet, der har en bestemt specificeret egenskab) i n af tegninger uden nogen erstatning fra en given populationsstørrelse N, der inkluderer nøjagtigt K-objekter, der har den funktion, hvor lodtrækningen måske lykkes eller måske mislykkes.

Formlen for sandsynligheden for en hypergeometrisk fordeling er afledt ved hjælp af et antal elementer i populationen, antal elementer i prøven, antal succeser i populationen, antal succeser i prøven og få kombinationer. Matematisk er sandsynligheden repræsenteret som,

P = K C k * (N - K) C (n - k) / N C n

hvor,

  • N = antal poster i befolkningen
  • n = Antal varer i prøven
  • K = antal succeser i befolkningen
  • k = antal succeser i prøven

Middel- og standardafvigelsen for en hypergeometrisk fordeling udtrykkes som,

Gennemsnit = n * K / N Standardafvigelse = (n * K * (N - K) * (N - n) / (N 2 * (N - 1))) 1/2

Forklaring

Trin 1: For det første skal du bestemme det samlede antal genstande i befolkningen, hvilket er betegnet med N. For eksempel er antallet af spillekort i en bunke 52.

Trin 2: Bestem derefter antallet af emner i prøven, betegnet med n-f.eks. Antallet af kort trukket fra bunken.

Trin 3: Bestem derefter de tilfælde, der vil blive betragtet som succeser i befolkningen, og det er betegnet med K. F.eks. Antallet af hjerter i det samlede dæk, som er 13.

Trin 4: Dernæst skal du bestemme de tilfælde, der betragtes som succeser i den trukkede prøve, og det er betegnet med k. F.eks. Antallet af hjerter i kortene trukket fra bunken.

Trin 5: Endelig afledes formlen for sandsynligheden for en hypergeometrisk fordeling ved hjælp af et antal poster i populationen (trin 1), antal elementer i prøven (trin 2), antal succeser i populationen (trin 3) og antal succeser i prøven (trin 4) som vist nedenfor.

P = K C k * (N - K) C (n - k) / N C n

Eksempler på hypergeometrisk distribution (med Excel-skabelon)

Eksempel nr. 1

Lad os tage eksemplet med en almindelig form for spillekortform, hvor 6 kort trækkes tilfældigt uden udskiftning. Bestem sandsynligheden for at trække nøjagtigt 4 røde suiter-kort, dvs. diamanter eller hjerter.

  • Angivet, N = 52 (da der er 52 kort i en almindelig spillebunke)
  • n = 6 (antal kort trukket tilfældigt fra bunken)
  • K = 26 (da der er 13 røde kort hver i diamanter og hjerter)
  • k = 4 (antallet af røde kort, der skal betragtes som vellykket i den trukkede prøve)

Løsning:

Derfor kan sandsynligheden for at trække nøjagtigt 4 røde suiter kort i de trukkede 6 kort beregnes ved hjælp af ovenstående formel som,

Sandsynlighed = K C k * (N - K) C (n - k) / N C n

= 26 C 4 * (52 - 26) C (6 - 4) / 52 C 6

= 26 C 4 * 26 C 2 / 52 C 6

= 14950 * 325/20358520

Sandsynligheden vil være -

Sandsynlighed = 0.2387 ~ 23.87%

Derfor er der 23,87% sandsynlighed for at trække nøjagtigt 4 røde kort, mens du trækker 6 tilfældige kort fra et almindeligt spil.

Eksempel 2

Lad os tage et andet eksempel på en tegnebog, der indeholder 5 $ 100 regninger og 7 $ 1 regninger. Hvis der vælges 4 regninger tilfældigt, skal du bestemme sandsynligheden for at vælge nøjagtigt 3 $ 100 regninger.

  • Angivet, N = 12 (antal $ 100 regninger + antal $ 1 regninger)
  • n = 4 (antal regninger valgt tilfældigt)
  • K = 5 (da der er 5 $ 100 regninger)
  • k = 3 (Antal $ 100-regninger, der betragtes som en succes i den valgte prøve)

Løsning:

Derfor kan sandsynligheden for at vælge nøjagtigt 3 $ 100 regninger i de tilfældigt valgte 4 regninger beregnes ved hjælp af ovenstående formel som,

Sandsynlighed = K C k * (N - K) C (n - k) / N C n

= 5 C 3 * (12 - 5) C (4 - 3) / 12 C 4

= 5 C 3 * 7 C 1 / 12 C 4

= 10 * 7/495

Sandsynligheden vil være -

Sandsynlighed = 0,1414 ~ 14,14%

Derfor er der en sandsynlighed på 14,14% for at vælge nøjagtigt 3 $ 100 regninger, mens du trækker 4 tilfældige regninger.

Relevans og anvendelser

Begrebet hypergeometrisk fordeling er vigtigt, fordi det giver en nøjagtig måde at bestemme sandsynlighederne på, når antallet af forsøg ikke er et meget stort antal, og at prøverne tages fra en endelig population uden erstatning. Faktisk er den hypergeometriske fordeling analog med den binomiale fordeling, som bruges, når antallet af forsøg er væsentligt stort. Imidlertid anvendes hypergeometrisk fordeling overvejende til prøveudtagning uden udskiftning.

Interessante artikler...