Randomisierungsdichte

100 Wiederholungen helfen dir, den Permutationsmechanismus zu verstehen. Aber 100 sind nicht genug, um den gesamten Bereich der plausiblen Werte für die Null-Differenzen in Anteilen zu sehen.

Erinnere dich an die vier Schritte der Inferenz. Es sind dieselben vier Schritte, die du in allen Inferenzübungen in diesem Kurs und in zukünftigen Kursen zur statistischen Inferenz verwenden wirst. Nutze die Funktionsnamen, um dir den Analyseprozess einzuprägen.

specify gibt die Antwort- und erklärenden Variablen an.
hypothesize formuliert die Nullhypothese.
generate erzeugt Resamples, Permutationen oder Simulationen.
calculate berechnet die Kenngrößen.

In dieser Übung wiederholst du den Prozess 1000-mal, um ein Gefühl für die vollständige Verteilung der Null-Differenzen in Anteilen zu bekommen.

Diese Übung ist Teil des Kurses

<Kurs>Grundlagen der Inferenz in R</Kurs>

Kurs ansehen

Übungsanweisungen

Die Pakete dplyr, ggplot2, NHANES und infer wurden für dich geladen.

Erzeuge 1000 Differenzen in Anteilen, indem du die Variable HomeOwn mithilfe der infer-Syntax durchmischst. Zur Erinnerung, die infer-Syntax:
- specify, dass der Zusammenhang von Interesse HomeOwn vs. Gender ist und ein Erfolg in diesem Kontext Wohneigentum ist, success = "Own".
- hypothesize, dass die Null gilt, also null = "independence" (bedeutet: Geschlecht und Wohneigentum hängen nicht zusammen).
- generate 1000 Permutationen; setze reps auf 1000.
- calculate die Kennzahl stat = "diff in props" mit der Reihenfolge c("male", "female").
Führe den Code für das Dichte-Diagramm aus, um eine geglättete visuelle Darstellung der Verteilung der Differenzen zu erstellen. Welche Form hat die Kurve?

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Perform 1000 permutations
homeown_perm <- homes %>%
  # Specify HomeOwn vs. Gender, with `"Own" as success
  ___(___ ~ ___, success = "___") %>%
  # Use a null hypothesis of independence
  ___(___) %>% 
  # Generate 1000 repetitions (by permutation)
  ___(reps = ___, type = "permute") %>% 
  # Calculate the difference in proportions (male then female)
  ___(___, order = ___))

# Density plot of 1000 permuted differences in proportions
ggplot(homeown_perm, aes(x = stat)) + 
  geom_density()

Code bearbeiten und ausführen