LoslegenKostenlos loslegen

Schritt für Schritt durch die Permutation

Damit du den Code zur Erstellung der Randomisierungsverteilung besser verstehst, führt dich diese Übung Schritt für Schritt durch das infer-Framework. Dabei siehst du insbesondere, wie sich Unterschiede in den erzeugten Replikaten auf die berechneten Statistiken auswirken.

Nachdem du die infer-Schritte ausgeführt hast, achte darauf, dass sich die Zahlen für jedes Replikat leicht unterscheiden.

Diese Übung ist Teil des Kurses

Grundlagen der Inferenz in R

Kurs anzeigen

Anleitung zur Übung

Die Pakete dplyr und infer wurden für dich geladen, ebenso der Data Frame disc aus der letzten Übung.

  • Rufe die Funktionen für die ersten drei Schritte auf. Die Arbeit ist für dich vorbereitet, deine Aufgabe ist es, die Ergebnisse der ersten drei infer-Schritte zu untersuchen.
  • Um den Effekt der Permutation zu sehen,
    • gruppiere den permutierten Data Frame disc_perm nach der neuen Variable replicate und
    • zähle die Variablen von Interesse (promote innerhalb jedes sex) mit count().
  • Verwende disc_perm, um mit calculate() die relevante Statistik zu berechnen. Setze stat auf "diff in props" und order auf c("male", "female").

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
  specify(promote ~ sex, success = "promoted") %>%
  hypothesize(null = "independence") %>%
  generate(reps = 5, type = "permute")

disc_perm %>%
  # Group by replicate
  ___ %>%
  # Count per group
  ___

disc_perm %>%
  # Calculate difference in proportion, male then female
  ___
Code bearbeiten und ausführen