Il campionamento sistematico va bene?
Il campionamento sistematico ha un problema: se i dati sono stati ordinati, o se c’è qualche schema o significato nell’ordine delle righe, il campione risultante potrebbe non essere rappresentativo dell’intera popolazione. Il problema si può risolvere mescolando le righe, ma a quel punto il campionamento sistematico equivale al campionamento casuale semplice.
Qui vedrai come capire se c’è o meno un problema.
attrition_pop è disponibile; pandas è caricato come pd e matplotlib.pyplot come plt.
Questo esercizio fa parte del corso
Campionamento in Python
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Add an index column to attrition_pop
attrition_pop_id = ____
# Plot YearsAtCompany vs. index for attrition_pop_id
____
plt.show()