T-test (definition, typer) - Trin for trin beregningseksempler

Indholdsfortegnelse

Hvad er T-Test?

En T-test er en metode, der bruges til at udlede en slutning i statistik, som har til formål at finde ud af, om der er nogen større forskel mellem to midler, hvor de to betragtede grupper kan være relateret til hinanden.

Forklaring

  • Det er rettet mod hypotesetest, som grundlæggende bruges til at teste en hypotese vedrørende en given befolkning. En T-test overvejer T-statistik, T-fordelingsværdier og frihedsgrader, som bruges til at bestemme sandsynligheden for forskellen mellem to datasæt.
  • Det grundlæggende arbejde bag T-Test er, at det betragter en prøve fra hvert af de to sæt og bygger en problemstilling ved at overveje en nulhypotese, hvor begge midler er angivet som lige.
  • På basis af ligningsformler tegnes og sammenlignes værdier med standardværdierne, hvilket yderligere fører til accept eller afvisning af nulhypotesen. Afvisningen af ​​nulhypotesen indikerer, at datasættet er ret nøjagtigt og ikke tilfældigt.

Typer af T-test

Der er primært fire typer t-test, som er som følger:

# 1 - 1-prøve T-test

Det er beregnet til test, hvis gennemsnittet af den værdi, man har målrettet mod, er lig med gennemsnittet for en enkelt befolkning, f.eks. Test af, om gennemsnitsvægten for klasse 5-studerende er mere end 45 kg

# 2 - 2-prøve T-test

Det sigter til at teste, om gennemsnittet af den værdi, man har målrettet mod, er lig med gennemsnittet for to uafhængige befolkninger, f.eks. At teste, om gennemsnitsvægten for klasse 5-drengestuderende er forskellig fra klasse 5-pigestuderende.

# 3 - Parret T-test

Det sigter til test, om gennemsnittet af den værdi, man har målrettet mod, er lig med gennemsnittet af forskelle mellem de observationer, der er afhængige. F.eks. hjælper det med at sammenligne studerendes karakterer før og efter undervisningen for hvert fag os med at identificere, om det at tage undervisning er signifikant nok til at forbedre de studerendes karakterer.

# 4 - T-test i regressionsoutput

Det tager hensyn til koefficienten i regressionsligningen og tester i hvilken grad den adskiller sig fra nulværdien. F.eks. Hvis optagelseseksamen er en væsentlig faktor for at afgøre, om en studerende opnår en god slutresultat.

Antagelser om T-test

  • Den første antagelse for en t-test er relateret til måleskalaen. Dette er relateret til, om skalaen følger en kontinuerlig eller ordinær skala
  • Den anden antagelse kan være med hensyn til stikprøvenes tilfældige karakter. Dette betyder, at de indsamlede data skal være rent tilfældige.
  • Den tredje antagelse kan være, at når vi plotter data relateret til t-testfordeling, skal de følge en normalfordeling og frembringe en klokkekurve.
  • Den fjerde antagelse kan være, at vi for t-distribution og specifikt for at opnå en form af klokkekurven skal have en større stikprøvestørrelse.
  • Den endelige antagelse kan være den for t-testen. Variationen skal være homogen. e. standardafvigelserne er næsten lige store.

Sådan beregnes?

Det fungerer i to forskellige scenarier, dvs. en for den uafhængige prøve og en anden for den afhængige prøve.

# 1 - Uafhængig eksempelscenario

  • Vi er nødt til at beregne summen, stikprøvestørrelsen, der bestemmes af "N", og scoreværdien for gennemsnittet for hver af de uafhængige prøver. Efter dette skal frihedsgraden beregnes for hver uafhængig prøve.
  • Dette er repræsenteret ved at trække prøven fra en, som vi betegner som "n-1". Herefter skal variansen og standardafvigelsen beregnes.
  • Prøvernes frihedsgrader tilføjes, og dette betegnes som "df-total." Dernæst er vi nødt til at multiplicere frihedsgraden for hver prøve med variansen for hver. Vi er nødt til at tilføje de resulterende og derefter dividere det samlede antal med "df-total." Det opnåede resultat kaldes den samlede varians.
  • Den samlede varians divideres derefter med n af prøverne. Det opnåede resultat for alle prøverne tilføjes derefter. Kvadratroden af ​​dette tages, og dette betegnes som standardfejlen for forskellen.
  • Endelig er vi nødt til at trække det nederste gennemsnit af prøven fra det større gennemsnit af prøven. Den opnåede forskel divideres derefter med standardfejlen for forskellen, og de opnåede resultater kaldes T-værdien.

# 2 - Afhængig prøvescenario

  • Scorerne opnået fra hvert af parene af datasættet noteres, og vi skal trække det. De opnåede forskelle tilføjes og betegnes som "D." Forskellene i hver prøve firkantes og tilføjes for at opnå et resultat kaldet "D-Squared". Efter dette er vi nødt til at multiplicere "N" eller antallet af scoringer parret med "D-kvadratet."
  • Det opnåede resultat trækkes fra kvadratet af det samlede ”D.” Dette resultat divideres yderligere med “N-1”. Kvadratroden af ​​den resulterende opnås og betegnes som en skillevæg. Endelig er vi nødt til at dele det totale "D" med divisoren, hvilket giver os den endelige t-værdi.

Eksempler på T-test

Lad os overveje, at vi har scoringer for hvert emne i eksamen, der afholdes i to perioder.

Trin 1: Træk fase 1 fra fase 2

Trin 2: Tilføj hele forskellen, dvs. -55

Trin 3: Kvadrerer forskellene

Trin 4: Læg alle firkanterne i forskel, dvs. 983, sammen

Trin 5: Brug af formlen til at beregne T-værdien

T = ((∑D) / N) / √ (∑D 2 - (∑D) 2 / N)) / (N-1) - N
  • = -9,16 / √ (983 - (- 55) 2 /6)) / (6-1) * 6
  • = -9,16 / √15,96
  • = -9,16 / 3,99
  • T-værdi = -2,29

Den opnåede T-værdi sammenlignes derefter med T-værdien opnået fra tabellen under anvendelse af p-værdi og frihedsgrad. Hvis den beregnede t-værdi er større end tabelværdien på et specifikt foruddefineret alfa-niveau, kan vi afvise nulhypotesen og sige, at der er en forskel mellem midlerne.

Når det bruges?

Dette bruges til at sammenligne to midler eller proportioner. Vi bruger også en t-test, når populationsparametrene er ukendte for brugeren. Der er stort set tre tilfælde af brug af t-testscenarier, som er som følger:

  • En uafhængig prøve t-test bruges, når vi vil sammenligne gennemsnittet af to grupper.
  • En parret prøve t-test bruges, når vi vil sammenligne gennemsnittet for den samme gruppe, men på forskellige tidspunkter.
  • En prøve t-test bruges, når vi har brug for at kontrollere gennemsnittet for en individuel gruppe mod et ukendt gennemsnit.

T-testbrug i Excel

  • I Excel er den første og fremmeste ting, vi har brug for, installationen af ​​et tilføjelsesprogram kaldet dataanalyse. Herefter skal vi gå til "Data" i menufanen og klikke på den. Indstillingen "Dataanalyse" vil være synlig der.
  • For at gennemføre en T-test skal vi have vores data i et søjleformat. Ved klik på "Dataanalyse" får vi et antal statistiske tests, som vi kan udføre, og fra listen skal vi vælge en t-test og klikke på "Ok."
  • En dialogboks kommer op, hvor vi har brug for at indtaste dataene for spor 1 i feltet variabelt område 1 og også prøve 2-dataene i felterne med variabelt område 2. Som standard forbliver alfa-værdien på 0,05, men dette kan ændres ud fra vores præference. Når alt er i orden, skal du klikke på "OK".
  • Vi kan nu se resultatet af vores T-test på excel-arket. Den vigtigste værdi her at bemærke er P-værdi. På hvad vi har valgt vores alfa-værdi, hvis vores P-værdi i excel er mindre end alfa-værdien, kan vi konkludere, at der er en statistisk materialeforskel mellem middelværdien af ​​vores to sæt værdier.

Konklusion

T-testen er rettet mod hypotesetest, som grundlæggende bruges til at teste en hypotese vedrørende en given befolkning. Det fortæller os niveauet af betydning for forskellen mellem grupperne, som generelt måles på basis af middelværdien. Her finder vi grundlæggende ud af forskellen mellem populationsmiddel og en hypoteseværdi.

Interessante artikler...