Zwei-Stichproben-Mittelwert-Teststatistik
Der Hypothesentest, mit dem festgestellt werden soll, ob es einen Unterschied zwischen den Mittelwerten zweier Populationen gibt, verwendet eine andere Art von Teststatistik als die z-Werte, die du in Kapitel 1 gesehen hast. Sie wird „t“ genannt und kann mit dieser Gleichung aus drei Werten jeder Stichprobe berechnet werden.
$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$
Wenn du versuchst herauszufinden, warum einige Sendungen zu spät kommen, fragst du dich vielleicht, ob das Gewicht der Sendungen, die pünktlich waren, kleiner ist als das Gewicht der Sendungen, die zu spät kamen. Der Datensatz late_shipments
wurde in eine „Ja“-Gruppe (mit late == "Yes"
) und eine „Nein“-Gruppe (mit late == "No"
) aufgeteilt. Das Gewicht der Sendung wird in der Variable weight_kilograms
angegeben.
Die Stichprobenmittelwerte für die beiden Gruppen sind als xbar_no
und xbar_yes
verfügbar. Die Standardabweichungen der Stichprobe sind s_no
und s_yes
. Die Stichprobengrößen sind n_no
und n_yes
. numpy
wird auch als np
geladen.
Diese Übung ist Teil des Kurses
Hypothesentests in Python
Anleitung zur Übung
- Berechne den Zähler der \(t\)-Teststatistik.
- Berechne den Nenner der \(t\)-Teststatistik.
- Benutze diese beiden Zahlen, um die \(t\)-Teststatistik zu berechnen.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Calculate the numerator of the test statistic
numerator = ____
# Calculate the denominator of the test statistic
denominator = ____
# Calculate the test statistic
t_stat = ____
# Print the test statistic
print(t_stat)