Randomisierungsdichte
100 Wiederholungen helfen dir, den Permutationsmechanismus zu verstehen. Aber 100 sind nicht genug, um den gesamten Bereich der plausiblen Werte für die Null-Differenzen in Anteilen zu sehen.
Erinnere dich an die vier Schritte der Inferenz. Es sind dieselben vier Schritte, die du in allen Inferenzübungen in diesem Kurs und in zukünftigen Kursen zur statistischen Inferenz verwenden wirst. Nutze die Funktionsnamen, um dir den Analyseprozess einzuprägen.
specifygibt die Antwort- und erklärenden Variablen an.hypothesizeformuliert die Nullhypothese.generateerzeugt Resamples, Permutationen oder Simulationen.calculateberechnet die Kenngrößen.
In dieser Übung wiederholst du den Prozess 1000-mal, um ein Gefühl für die vollständige Verteilung der Null-Differenzen in Anteilen zu bekommen.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
Die Pakete dplyr, ggplot2, NHANES und infer wurden für dich geladen.
- Erzeuge 1000 Differenzen in Anteilen, indem du die Variable
HomeOwnmithilfe derinfer-Syntax durchmischst. Zur Erinnerung, dieinfer-Syntax:specify, dass der Zusammenhang von InteresseHomeOwnvs.Genderist und ein Erfolg in diesem Kontext Wohneigentum ist,success = "Own".hypothesize, dass die Null gilt, alsonull = "independence"(bedeutet: Geschlecht und Wohneigentum hängen nicht zusammen).generate1000 Permutationen; setzerepsauf 1000.calculatedie Kennzahlstat = "diff in props"mit der Reihenfolgec("male", "female").
- Führe den Code für das Dichte-Diagramm aus, um eine geglättete visuelle Darstellung der Verteilung der Differenzen zu erstellen. Welche Form hat die Kurve?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Perform 1000 permutations
homeown_perm <- homes %>%
# Specify HomeOwn vs. Gender, with `"Own" as success
___(___ ~ ___, success = "___") %>%
# Use a null hypothesis of independence
___(___) %>%
# Generate 1000 repetitions (by permutation)
___(reps = ___, type = "permute") %>%
# Calculate the difference in proportions (male then female)
___(___, order = ___))
# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) +
geom_density()