Schritt für Schritt durch die Permutation
Damit du den Code zur Erstellung der Randomisierungsverteilung besser verstehst, führt dich diese Übung Schritt für Schritt durch das infer-Framework. Dabei siehst du insbesondere, wie sich Unterschiede in den erzeugten Replikaten auf die berechneten Statistiken auswirken.
Nachdem du die infer-Schritte ausgeführt hast, achte darauf, dass sich die Zahlen für jedes Replikat leicht unterscheiden.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
Die Pakete dplyr und infer wurden für dich geladen, ebenso der Data Frame disc aus der letzten Übung.
- Rufe die Funktionen für die ersten drei Schritte auf. Die Arbeit ist für dich vorbereitet, deine Aufgabe ist es, die Ergebnisse der ersten drei
infer-Schritte zu untersuchen. - Um den Effekt der Permutation zu sehen,
- gruppiere den permutierten Data Frame
disc_permnach der neuen Variablereplicateund - zähle die Variablen von Interesse (
promoteinnerhalb jedessex) mitcount().
- gruppiere den permutierten Data Frame
- Verwende
disc_perm, um mitcalculate()die relevante Statistik zu berechnen. Setzestatauf"diff in props"undorderaufc("male", "female").
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Replicate the entire data frame, permuting the promote variable
disc_perm <- disc %>%
specify(promote ~ sex, success = "promoted") %>%
hypothesize(null = "independence") %>%
generate(reps = 5, type = "permute")
disc_perm %>%
# Group by replicate
___ %>%
# Count per group
___
disc_perm %>%
# Calculate difference in proportion, male then female
___