IniziaInizia gratis

Il campionamento sistematico va bene?

Il campionamento sistematico ha un problema: se i dati sono stati ordinati o c'è qualche tipo di schema o significato nell'ordine delle righe, il campione risultante potrebbe non essere rappresentativo dell'intera popolazione. Il problema si può risolvere mescolando le righe; tuttavia, in quel caso il campionamento sistematico diventa equivalente al campionamento casuale semplice.

Qui vedrai come capire se c'è o meno un problema.

attrition_sys_samp è disponibile ed è stata aggiunta una colonna con l'ID di riga; dplyr e ggplot2 sono caricati.

Questo esercizio fa parte del corso

Campionamento in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Add a row ID column to attrition_pop
attrition_pop_id <- attrition_pop %>% 
  rowid_to_column()

# Using attrition_pop_id, plot YearsAtCompany vs. rowid
___ +
  # Make it a scatter plot
  ___ +
  # Add a smooth trend line
  ___
Modifica ed esegui il codice