Ist systematische Stichprobenziehung okay?
Bei der systematischen Stichprobenziehung gibt es ein Problem: Wenn die Daten sortiert sind oder irgendein Muster bzw. eine Bedeutung hinter der Zeilenreihenfolge steckt, ist die gezogene Stichprobe möglicherweise nicht repräsentativ für die gesamte Grundgesamtheit. Das Problem lässt sich lösen, indem du die Zeilen mischst – dann entspricht die systematische Stichprobe jedoch einer einfachen Zufallsstichprobe.
Hier schaust du dir an, wie du erkennst, ob es ein Problem gibt oder nicht.
attrition_sys_samp ist verfügbar und hat eine Spalten-ID für die Zeilen erhalten; dplyr und ggplot2 sind geladen.
Diese Übung ist Teil des Kurses
Stichprobenerhebung in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>%
rowid_to_column()
# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
# Make it a scatter plot
___ +
# Add a smooth trend line
___