LoslegenKostenlos starten

Schritt für Schritt durch die Permutation

Damit du den Code zur Erstellung der Randomisierungsverteilung besser verstehst, führt dich diese Übung Schritt für Schritt durch das infer-Framework. Dabei siehst du insbesondere, wie sich Unterschiede in den erzeugten Replikaten auf die berechneten Statistiken auswirken.

Nachdem du die infer-Schritte ausgeführt hast, achte darauf, dass sich die Zahlen für jedes Replikat leicht unterscheiden.

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in R</Kurs>
Kurs ansehen

Übungsanweisungen

Die Pakete dplyr und infer wurden für dich geladen, ebenso der Data Frame disc aus der letzten Übung.

  • Rufe die Funktionen für die ersten drei Schritte auf. Die Arbeit ist für dich vorbereitet, deine Aufgabe ist es, die Ergebnisse der ersten drei infer-Schritte zu untersuchen.
  • Um den Effekt der Permutation zu sehen,
    • gruppiere den permutierten Data Frame disc_perm nach der neuen Variable replicate und
    • zähle die Variablen von Interesse (promote innerhalb jedes sex) mit count().
  • Verwende disc_perm, um mit calculate() die relevante Statistik zu berechnen. Setze stat auf "diff in props" und order auf c("male", "female").

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
  specify(promote ~ sex, success = "promoted") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute")

disc_perm %>%
  # Group by replicate
  ___ %>%
  # Count per group
  ___

disc_perm %>%
  # Calculate difference in proportion, male then female
  ___
Code bearbeiten und ausführen