Simulationsbasierter t-Test

In Kapitel 2 hast du manuell die Schritte für einen t-Test durchgeführt, um diese Hypothesen zu untersuchen.

\(H_{0}\): Das durchschnittliche Gewicht der Sendungen, die nicht verspätet waren, ist gleich dem durchschnittlichen Gewicht der Sendungen, die verspätet waren.

\(H_{A}\): Das durchschnittliche Gewicht der Sendungen, die nicht verspätet waren, ist geringer als das durchschnittliche Gewicht der Sendungen, die verspätet waren.

Du kannst den Test mit infer's t_test() präziser durchführen.

late_shipments %>% 

  t_test(

    weight_kilograms ~ late,

    order = c("No", "Yes"),

    alternative = "less"

  )

t_test() geht davon aus, dass die Nullverteilung normal ist. Wir können Annahmen vermeiden, indem wir ein simulationsbasiertes nicht-parametrisches Äquivalent verwenden.

late_shipments ist verfügbar; dplyr und infer sind geladen.

Diese Übung ist Teil des Kurses

Hypothesentests in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fill out the null distribution pipeline
null_distn <- late_shipments %>% 
  # Specify weight_kilograms vs. late
  ___ %>% 
  # Declare a null hypothesis of independence
  ___ %>% 
  # Generate 1000 permutation replicates
  ___ %>% 
  # Calculate the difference in means ("No" minus "Yes")
  ___

# See the results
null_distn

Code bearbeiten und ausführen