Zwei-Stichproben-Mittelwert-Teststatistik

Der Hypothesentest, mit dem festgestellt werden soll, ob es einen Unterschied zwischen den Mittelwerten zweier Populationen gibt, verwendet eine andere Art von Teststatistik als die z-Werte, die du in Kapitel 1 gesehen hast. Sie wird „t“ genannt und kann mit dieser Gleichung aus drei Werten jeder Stichprobe berechnet werden.

$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$

Wenn du versuchst herauszufinden, warum einige Sendungen zu spät kommen, fragst du dich vielleicht, ob das Gewicht der Sendungen, die pünktlich waren, kleiner ist als das Gewicht der Sendungen, die zu spät kamen. Der Datensatz late_shipments wurde in eine „Ja“-Gruppe (mit late == "Yes") und eine „Nein“-Gruppe (mit late == "No") aufgeteilt. Das Gewicht der Sendung wird in der Variable weight_kilograms angegeben.

Die Stichprobenmittelwerte für die beiden Gruppen sind als xbar_no und xbar_yes verfügbar. Die Standardabweichungen der Stichprobe sind s_no und s_yes. Die Stichprobengrößen sind n_no und n_yes. numpy wird auch als np geladen.

Diese Übung ist Teil des Kurses

Hypothesentests in Python

Kurs anzeigen

Anleitung zur Übung

Berechne den Zähler der $t$-Teststatistik.
Berechne den Nenner der $t$-Teststatistik.
Benutze diese beiden Zahlen, um die $t$-Teststatistik zu berechnen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate the numerator of the test statistic
numerator = ____

# Calculate the denominator of the test statistic
denominator = ____

# Calculate the test statistic
t_stat = ____

# Print the test statistic
print(t_stat)

Code bearbeiten und ausführen