Il campionamento sistematico va bene?
Il campionamento sistematico ha un problema: se i dati sono stati ordinati o c'è qualche tipo di schema o significato nell'ordine delle righe, il campione risultante potrebbe non essere rappresentativo dell'intera popolazione. Il problema si può risolvere mescolando le righe; tuttavia, in quel caso il campionamento sistematico diventa equivalente al campionamento casuale semplice.
Qui vedrai come capire se c'è o meno un problema.
attrition_sys_samp è disponibile ed è stata aggiunta una colonna con l'ID di riga; dplyr e ggplot2 sono caricati.
Questo esercizio fa parte del corso
Campionamento in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>%
rowid_to_column()
# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
# Make it a scatter plot
___ +
# Add a smooth trend line
___