Stammen die Daten aus der Grundgesamtheit?
Erinnere dich: Die beobachtete Differenz (also die Differenz der Anteile im Datensatz homes, dargestellt als rote vertikale Linie) lag bei etwa -0,0078 und scheint unterhalb des Großteils der Dichte der gemischten Differenzen zu liegen. Wichtig ist jedoch zu wissen, ob eine der zufällig permutierten Differenzen genauso extrem war wie die beobachtete Differenz.
In dieser Übung erstellst du das Punktdiagramm als Dichteplot nach und zählst die Anzahl der permutierten Differenzen, die links von der beobachteten Differenz lagen.
Diese Übung ist Teil des Kurses
Grundlagen der Inferenz in R
Anleitung zur Übung
Der Datensatz homeown_perm steht dir in deinem Workspace zur Verfügung.
- Verwende
geom_density(), um die permutierten Differenzen zu plotten. - Füge mit
geom_vline()eine vertikale rote Linie an der Stelle ein, an der die beobachtete Differenz liegt.diff_origist in deinem Workspace vorhanden und steht für den ursprünglichen Wert der Differenzstatistik. - Zähle die Anzahl der permutierten Differenzen, die kleiner oder gleich der beobachteten Differenz waren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plot permuted differences, diff_perm
ggplot(homeown_perm, aes(x = ___)) +
# Add a density layer
___() +
# Add a vline layer with intercept diff_orig
___(aes(xintercept = ___), color = "red")
# Compare permuted differences to observed difference
homeown_perm %>%
summarize(n_perm_le_obs = sum(___ <= ___))