Toetsstatistiek voor twee gemiddelden

De hypothesetoets om te bepalen of er een verschil is tussen de gemiddelden van twee populaties gebruikt een ander type toetsstatistiek dan de z-scores die je in hoofdstuk één zag. Deze heet "t" en kan worden berekend uit drie waarden per steekproef met de volgende formule.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

Als je wilt achterhalen waarom sommige zendingen te laat zijn, vraag je je misschien af of het gewicht van de zendingen die te laat waren verschilt van het gewicht van de zendingen die op tijd waren. De late_shipments-gegevensset is opgesplitst in een "yes"-groep, waar late == "Yes", en een "no"-groep, waar late == "No". Het gewicht van de zending staat in de variabele weight_kilograms.

Voor het gemak zijn de steekproefgemiddelden voor de twee groepen beschikbaar als xbar_no en xbar_yes. De steekproefstandaardafwijkingen zijn s_no en s_yes. De steekproefomvang is n_no en n_yes.

Deze oefening maakt deel uit van de cursus

Hypothesis Testing in R

Bekijk cursus

Oefeninstructies

Bereken de teller van de toetsstatistiek.
Bereken de noemer van de toetsstatistiek.
Gebruik die twee getallen om de toetsstatistiek te berekenen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Calculate the numerator of the test statistic
numerator <- ___

# Calculate the denominator of the test statistic
denominator <- ___

# Calculate the test statistic
t_stat <- ___

# See the result
t_stat

Code bewerken en uitvoeren