Empirisk regel - Definition, formel, hvordan man bruger i statistik?

Hvad er den empiriske regel i statistik?

Empirisk regel i statistik siger, at næsten alle (95%) af observationer i en normalfordeling ligger inden for 3 standardafvigelser fra gennemsnittet. Dette er en meget vigtig regel og hjælper med at forudsige.

Formel

Formlen viser den forudsagte procentdel af observationer, der ligger inden for hver standardafvigelse fra gennemsnittet.

Reglen siger, at:

  • 68% af observationerne ligger inden for +/- 1 standardafvigelse fra gennemsnittet
  • 95% af observationerne ligger inden for +/- 2 standardafvigelser fra gennemsnittet
  • 7% af observationerne ligger inden for +/- 3 standardafvigelser fra gennemsnittet

Sådan bruges?

Dette bruges i prognosetrenden for et datasæt. Når datasættet er omfattende, og det bliver udfordrende at undersøge hele befolkningen, kan empirisk regel anvendes på stikprøven for at få et skøn over, hvordan dataene i befolkningen vil reagere, hvis du bliver bedt om at finde gennemsnitslønnen for alle revisorerne i USA. Så er det en vanskelig opgave at udføre, da befolkningssættet er enormt. Så i så fald kan du vælge, siger, 90 observationer tilfældigt fra hele befolkningen.

Så nu får du 90 lønninger. Du skal finde den gennemsnitlige og standardafvigelse af observationerne. Hvis observationen følger en normalfordeling, kan dette anvendes, og der kan foretages et skøn over lønnen for alle revisorer i USA.

Sig, at gennemsnitslønnen for prøven bliver $ 90.000. Og standardafvigelsen er $ 5.000. Så ud af hele befolkningen trækker 68% af regnskabsførerne en løn, der ligger mellem +/- 1 standardafvigelser fra gennemsnittet. Som middelværdien er $ 90.000, og standardafvigelsen er $ 5.000. Så 68% af alle revisorer i USA får betalt i intervallet $ 90.000 +/- (1 * $ 5.000). Det er inden for $ 85.000 til $ 95.000

Hvis vi spreder lidt mere, bliver 95% af alle revisorer i USA betalt inden for området + + 2 standardafvigelser. $ 90.000 +/- (2 * 5000). Så rækkevidden er $ 80.000 til $ 100.000.

I et bredere interval trækker 99,7% af alle revisorer løn, der spænder fra gennemsnitlige +/- 3 standardafvigelser. Det vil sige 90.000 +/- (3 * 5000). Området er $ 75.000 til $ 105.000

Du kan tydeligt se, at uden at studere hele befolkningen, kunne der foretages et skøn over befolkningen. Hvis nogen planlægger at arbejde som revisor i USA, kan han let forvente, at hans løn vil variere fra $ 75.000 til $ 105.000

Denne form for skøn hjælper med at lette arbejdet og lave prognoser vedrørende fremtiden.

Eksempler på empiriske regler

Mr. X forsøger at finde det gennemsnitlige antal år, en person overlever efter pensionering, idet han betragter pensionsalderen til at være 60. Hvis den gennemsnitlige overlevelsesår på 50 tilfældige observationer er 20 år og SD er 3, skal du finde ud af sandsynligheden for, at en personen trækker pension i mere end 23 år

Løsning

Den empiriske regel siger, at 68% af observationerne vil ligge inden for 1 standardafvigelse fra gennemsnittet. Her er gennemsnittet af observationer 20.

68% af observationerne ligger inden for 20 +/- 1 (standardafvigelse), hvilket er 20 +/- 3. Så området er 17 til 23.

Der er en 68% chance for, at minimumsårene, en person overlever efter pensionering, ligger mellem 17 og 23. Nu er den procentdel, der ligger uden for dette interval (100 - 68) = 32%. 32 fordeles ligeligt på begge sider, hvilket betyder en 16% chance for, at minimumsårene vil være under 17, og en 16% chance for, at minimumsårene vil være større end 23.

Så sandsynligheden for, at personen trækker mere end 23 års pension, er 16%.

Empirisk regel vs. Chebyshevs sætning

Empirisk regel anvendes på datasæt, der følger en normalfordeling, der betyder klokkeformet. I en normalfordeling har begge sider af fordelingen 50% sandsynlighed hver.

Hvis datasættet ikke normalt distribueres, er der en anden tilnærmelse eller regel, der gælder for alle typer datasæt, som er Chebyshevs sætning. Det siger tre ting:

  • Mindst 3/4 th af alle observationer vil ligge indenfor 2Standard afvigelser fra middelværdien. Det er en stærk tilnærmelse. Det betyder, at hvis der er 100 observationer, ligger 3/4 th af observationer, der er 75 observationer, inden for +/- 2 standardafvigelser fra gennemsnittet.
  • Mindst 8/9 th af alle observationer vil ligge indenfor 3Standard afvigelser fra middelværdien.
  • Mindst 1 - 1 / k 2 af alle observationer ligger inden for K Standardafvigelser fra middelværdien. Her betegnes K som ethvert heltal.

Hvornår skal jeg bruge?

Data er som guld i den moderne verden. Der strømmer enorme data fra forskellige kilder og bruges til forskellige tilnærmelser eller prognoser. Hvis et datasæt følger en normalfordeling, viser det en klokkeformet kurve; derefter kan empirisk regel bruges. Det anvendes til observationer for at skabe en tilnærmelse til befolkningen.

Når det først er set, at observationer viser en normalfordelingsstruktur, følges empirisk regel for at finde flere sandsynligheder for observationer. Reglen er yderst nyttig til mange statistiske prognoser.

Konklusion

Empirisk regel er et statistisk koncept, der hjælper med at skildre sandsynligheden for observationer og er meget nyttig, når man finder en tilnærmelse til en enorm befolkning. Det skal altid bemærkes, at dette er tilnærmelser. Der er altid chancer for outliers, der ikke falder i fordelingen. Så resultaterne er ikke nøjagtige, og der bør træffes forsigtighedsforanstaltninger, når de fungerer som i prognosen.

Interessante artikler...