Is systematische steekproefname oké?
Systematische steekproefname heeft een nadeel: als de data gesorteerd is, of er zit een patroon of betekenis in de rijenvolgorde, dan is de resulterende steekproef mogelijk niet representatief voor de hele populatie. Je kunt dit oplossen door de rijen te schudden, maar dan komt systematische steekproefname neer op een eenvoudige aselecte steekproef.
Hier kijk je hoe je kunt bepalen of er wel of geen probleem is.
attrition_sys_samp is beschikbaar en heeft een kolom met rij-ID gekregen; dplyr en ggplot2 zijn geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>%
rowid_to_column()
# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
# Make it a scatter plot
___ +
# Add a smooth trend line
___