Central grænsesætning (definition, formel) - Beregninger og eksempler

Definition af Central Limit Theorem

Den centrale grænse sætning siger, at tilfældige prøver af en populations tilfældig variabel med en hvilken som helst fordeling vil nærme sig at være en normal sandsynlighedsfordeling, når størrelsen på prøven øges, og den antager, at når størrelsen af ​​prøven i populationen overstiger 30, er gennemsnittet af prøven, hvor gennemsnittet af alle observationer for prøven vil være tæt på lig med gennemsnittet for befolkningen.

Formel for central grænsesætning

Vi har allerede diskuteret, at når prøvestørrelsen overstiger 30, får fordelingen form af en normalfordeling. Til bestemmelse af den normale fordeling af en variabel er det vigtigt at kende dens gennemsnit og dens varians. En normalfordeling kan angives som

X ~ N (µ, α)

Hvor

  • N = antal observationer
  • µ = gennemsnit af observationer
  • α = standardafvigelse

I de fleste tilfælde afslører observationer ikke meget i sin rå form. Så det er vigtigt at standardisere observationer for at kunne sammenligne det. Det gøres ved hjælp af z-score. Det er nødvendigt at beregne Z-score for en observation. Formlen til beregning af z-score er

Z = (X- µ) / α / √n

Hvor

  • Z = Z-score for observationerne
  • µ = gennemsnit af observationer
  • α = standardafvigelse
  • n = prøve størrelse

Forklaring

Den centrale grænsesætning siger, at tilfældige prøver af en tilfældig populationsvariabel med en hvilken som helst fordeling vil nærme sig at være en normal sandsynlighedsfordeling, når størrelsen på prøven øges. Den centrale grænsesætning antager, at da størrelsen af ​​prøven i populationen overstiger 30, vil gennemsnittet af prøven, som gennemsnittet af alle observationer for prøven, være tæt på lig med gennemsnittet for befolkningen. Også standardafvigelsen for prøven, når størrelsen på prøven overstiger 30, vil være lig med standardafvigelsen for populationen. Da prøven er tilfældigt valgt fra hele befolkningen, og størrelsen af ​​prøven er mere end 30, hjælper det med hypotesetestning og konstruktion af konfidensintervallet til hypotesetesten.

Eksempler på Central Limit Theorem Formula (med Excel-skabelon)

Eksempel nr. 1

Lad os forstå konceptet med en normalfordeling ved hjælp af et eksempel. Det gennemsnitlige afkast fra en gensidig fond er 12%, og standardafvigelsen fra det gennemsnitlige afkast for gensidig fondsinvestering er 18%. Hvis vi antager, at fordelingen af ​​afkastet normalt fordeles, så lad os fortolke fordelingen for afkastet i investeringen i investeringsfonden.

Givet,

  • Det gennemsnitlige afkast for investeringen vil være 12%
  • Standardafvigelsen vil være 18%

Så for at finde ud af afkastet for et 95% konfidensinterval kan vi finde ud af det ved at løse ligningen som

  • Øvre rækkevidde = 12 + 1,96 (18) = 47%
  • Nedre interval = 12 - 1,96 (18) = -23%

Resultatet betyder, at afkastet fra gensidig fond 95% af tiden vil være i intervallet 47% til -23%. I dette eksempel vil stikprøvestørrelsen, som er afkastet af en tilfældig stikprøve på mere end 30 observationer af afkast, give os resultatet for populationsafkastet fra den gensidige fond, da stikprøvefordelingen normalt fordeles.

Eksempel 2

Fortsæt med det samme eksempel, lad os bestemme, hvad der bliver resultatet for et 90% konfidensinterval

Givet,

  • Det gennemsnitlige afkast for investeringen vil være 12%
  • Standardafvigelsen vil være 18%

Så for at finde ud af afkastet til et 90% konfidensinterval kan vi finde det ud ved at løse ligningen som

  • Øvre rækkevidde = 12 + 1,65 (18) = 42%
  • Nedre interval = 12 - 1,65 (18) = -18%

Resultatet betyder, at afkastet fra gensidig fond 90% af tiden vil være i intervallet 42% til -18%.

Eksempel 3

Fortsæt med det samme eksempel, lad os bestemme, hvad der bliver resultatet for et 99% konfidensinterval

Givet,

  • Det gennemsnitlige afkast for investeringen vil være 12%
  • Standardafvigelsen vil være 18%

Så for at finde ud af afkastet til et 90% konfidensinterval kan vi finde det ud ved at løse ligningen som

  • Øvre rækkevidde = 12 + 2,58 (18) = 58%
  • Nedre interval = 12 - 2,58 (18) = -34%

Resultatet betyder, at afkastet fra gensidig fond 99% af tiden vil være i intervallet 58% til -34%.

Relevans og anvendelse

Den centrale grænsesætning er yderst gavnlig, da den giver forskeren mulighed for at forudsige gennemsnittet og standardafvigelsen for hele befolkningen ved hjælp af prøven. Da prøven er tilfældigt valgt fra hele populationen, og størrelsen af ​​prøven er mere end 30, vil enhver tilfældig prøvestørrelse taget fra befolkningen nærme sig at blive distribueret normalt, hvilket vil hjælpe med hypotesetestning og konstruktion af konfidensintervallet hypotese testning. Baseret på den centrale grænsesætning er forskeren i stand til at vælge en vilkårlig stikprøve fra hele befolkningen, og når størrelsen på prøven er mere end 30,så kan den forudsige populationen ved hjælp af prøven, da prøven vil følge en normalfordeling og også som middelværdien og standardafvigelsen for prøven vil være den samme som gennemsnittet og standardafvigelsen for befolkningen.

Interessante artikler...