Aan de slagGa gratis aan de slag

Toetsingsgrootheid voor twee steekproefgemiddelden

De hypothesetoets om te bepalen of er een verschil is tussen de gemiddelden van twee populaties gebruikt een andere toetsingsgrootheid dan de z-scores die je in Hoofdstuk 1 zag. Die heet "t" en je kunt hem berekenen uit drie waarden per steekproef met deze formule.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

Wanneer je probeert te achterhalen waarom sommige zendingen te laat zijn, kun je je afvragen of het gewicht van de zendingen die op tijd waren lager is dan het gewicht van de zendingen die te laat waren. De gegevensset late_shipments is opgesplitst in een "yes"-groep, waar late == "Yes", en een "no"-groep waar late == "No". Het gewicht van de zending staat in de variabele weight_kilograms.

De steekproefgemiddelden voor de twee groepen zijn beschikbaar als xbar_no en xbar_yes. De steekproefstandaardafwijkingen zijn s_no en s_yes. De steekproefomvang is n_no en n_yes. numpy is ook geladen als np.

Deze oefening maakt deel uit van de cursus

Hypothesetoetsen in Python

Cursus bekijken

Oefeninstructies

  • Bereken de teller van de \(t\)-toetsingsgrootheid.
  • Bereken de noemer van de \(t\)-toetsingsgrootheid.
  • Gebruik die twee getallen om de \(t\)-toetsingsgrootheid te berekenen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the numerator of the test statistic
numerator = ____

# Calculate the denominator of the test statistic
denominator = ____

# Calculate the test statistic
t_stat = ____

# Print the test statistic
print(t_stat)
Code bewerken en uitvoeren