Eenvoudige aselecte steekproef
De eenvoudigste manier om een populatie te bemonsteren, heb je al gezien. Dit heet een eenvoudige aselecte steekproef (vaak afgekort tot "SRS") en houdt in dat je rijen één voor één willekeurig kiest, waarbij elke rij evenveel kans heeft om gekozen te worden als elke andere.
In dit hoofdstuk pas je steekproefmethoden toe op een synthetische (fictieve) gegevensset over personeelsverloop van IBM, waarbij "attrition" in deze context betekent dat iemand het bedrijf verlaat.
attrition_pop is beschikbaar; pandas als pd is geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in Python
Oefeninstructies
- Neem 70 rijen uit
attrition_popmet een eenvoudige aselecte steekproef en zet de willekeurige seed op18900217. - Print de steekproefgegevensset,
attrition_samp. Wat valt je op aan de indexen?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Sample 70 rows using simple random sampling and set the seed
attrition_samp = ____
# Print the sample
____