Campionamento casuale semplice
Il metodo più semplice per campionare una popolazione è quello che hai già visto. Si chiama campionamento casuale semplice (a volte abbreviato in "SRS") e consiste nel selezionare righe a caso, una alla volta, dove ogni riga ha la stessa probabilità di essere scelta delle altre.
In questo capitolo applicherai i metodi di campionamento a un insieme di dati sintetico (fittizio) sull'attrition dei dipendenti di IBM, dove in questo contesto "attrition" significa lasciare l'azienda.
attrition_pop è disponibile; pandas come pd è già importato.
Questo esercizio fa parte del corso
Campionamento in Python
Istruzioni dell'esercizio
- Estrai un campione di 70 righe da
attrition_popusando il campionamento casuale semplice, impostando il seme casuale a18900217. - Stampa il dataset campione,
attrition_samp. Cosa noti sugli indici?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Sample 70 rows using simple random sampling and set the seed
attrition_samp = ____
# Print the sample
____