Schritt für Schritt durch die Permutation

Damit du den Code zur Erstellung der Randomisierungsverteilung besser verstehst, führt dich diese Übung Schritt für Schritt durch das infer-Framework. Dabei siehst du insbesondere, wie sich Unterschiede in den erzeugten Replikaten auf die berechneten Statistiken auswirken.

Nachdem du die infer-Schritte ausgeführt hast, achte darauf, dass sich die Zahlen für jedes Replikat leicht unterscheiden.

Diese Übung ist Teil des Kurses

Grundlagen der Inferenz in R

Kurs anzeigen

Anleitung zur Übung

Die Pakete dplyr und infer wurden für dich geladen, ebenso der Data Frame disc aus der letzten Übung.

Rufe die Funktionen für die ersten drei Schritte auf. Die Arbeit ist für dich vorbereitet, deine Aufgabe ist es, die Ergebnisse der ersten drei infer-Schritte zu untersuchen.
Um den Effekt der Permutation zu sehen,
- gruppiere den permutierten Data Frame disc_perm nach der neuen Variable replicate und
- zähle die Variablen von Interesse (promote innerhalb jedes sex) mit count().
Verwende disc_perm, um mit calculate() die relevante Statistik zu berechnen. Setze stat auf "diff in props" und order auf c("male", "female").

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
  specify(promote ~ sex, success = "promoted") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute")

disc_perm %>%
  # Group by replicate
  ___ %>%
  # Count per group
  ___

disc_perm %>%
  # Calculate difference in proportion, male then female
  ___

Code bearbeiten und ausführen