Simulationsbasierter t-Test
In Kapitel 2 hast du manuell die Schritte für einen t-Test durchgeführt, um diese Hypothesen zu untersuchen.
\(H_{0}\): Das durchschnittliche Gewicht der Sendungen, die nicht verspätet waren, ist gleich dem durchschnittlichen Gewicht der Sendungen, die verspätet waren.
\(H_{A}\): Das durchschnittliche Gewicht der Sendungen, die nicht verspätet waren, ist geringer als das durchschnittliche Gewicht der Sendungen, die verspätet waren.
Du kannst den Test mit infer's t_test()
präziser durchführen.
late_shipments %>%
t_test(
weight_kilograms ~ late,
order = c("No", "Yes"),
alternative = "less"
)
t_test()
geht davon aus, dass die Nullverteilung normal ist. Wir können Annahmen vermeiden, indem wir ein simulationsbasiertes nicht-parametrisches Äquivalent verwenden.
late_shipments
ist verfügbar; dplyr
und infer
sind geladen.
Diese Übung ist Teil des Kurses
Hypothesentests in R
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Fill out the null distribution pipeline
null_distn <- late_shipments %>%
# Specify weight_kilograms vs. late
___ %>%
# Declare a null hypothesis of independence
___ %>%
# Generate 1000 permutation replicates
___ %>%
# Calculate the difference in means ("No" minus "Yes")
___
# See the results
null_distn