Zwei-Stichproben-Mittelwert-Teststatistik
Der Hypothesentest, mit dem festgestellt werden soll, ob es einen Unterschied zwischen den Mittelwerten zweier Populationen gibt, verwendet eine andere Art von Teststatistik als die z-Werte, die du in Kapitel eins gesehen hast. Sie wird "t" genannt und kann mit Hilfe dieser Gleichung aus drei Werten jeder Probe berechnet werden.
$$ t = \dfrac{(\bar{x}_{\text{child}} - \bar{x}_{\text{adult}})}{\sqrt{\dfrac{s_{\text{child}}^2}{n_{\text{child}}} + \dfrac{s_{\text{adult}}^2}{n_{\text{adult}}}}} $$
Wenn du versuchst herauszufinden, warum einige Sendungen zu spät kommen, fragst du dich vielleicht, ob sich das Gewicht der verspäteten Sendungen von dem der pünktlichen Sendungen unterscheidet. Der Datensatz late_shipments
wurde in eine "Ja"-Gruppe ( late == "Yes"
) und eine "Nein"-Gruppe ( late == "No"
) aufgeteilt. Das Gewicht der Sendung wird in der Variable weight_kilograms
angegeben.
Der Einfachheit halber sind die Stichprobenmittelwerte für die beiden Gruppen als xbar_no
und xbar_yes
verfügbar. Die Standardabweichungen der Stichprobe sind s_no
und s_yes
. Die Stichprobengrößen sind n_no
und n_yes
.
Diese Übung ist Teil des Kurses
Hypothesentests in R
Anleitung zur Übung
- Berechne den Zähler der Teststatistik.
- Berechne den Nenner der Teststatistik.
- Benutze diese beiden Zahlen, um die Teststatistik zu berechnen.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Calculate the numerator of the test statistic
numerator <- ___
# Calculate the denominator of the test statistic
denominator <- ___
# Calculate the test statistic
t_stat <- ___
# See the result
t_stat