Eenvoudige aselecte steekproef
De eenvoudigste manier om een populatie te steekproeven heb je al gezien. Dit heet eenvoudige aselecte steekproef (vaak afgekort tot "SRS") en houdt in dat je rijen één voor één willekeurig kiest, waarbij elke rij evenveel kans heeft om gekozen te worden als elke andere.
Om makkelijker te zien welke rijen in de steekproef terechtkomen, is het handig om vóór het nemen van de steekproef een rij-ID-kolom aan de gegevensset toe te voegen.
In dit hoofdstuk bekijken we steekproefmethoden met een synthetische (fictieve) IBM-gegevensset over personeelsverloop, waarbij "attrition" betekent dat iemand het bedrijf verlaat.
attrition_pop is beschikbaar; dplyr is geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in R
Oefeninstructies
- Bekijk de gegevensset
attrition_pop. Verken hem in de viewer totdat je duidelijk hebt wat erin zit. - Stel de willekeurzaadwaarde in op een door jou gekozen waarde.
- Voeg een rij-ID-kolom toe aan de gegevensset en gebruik vervolgens een eenvoudige aselecte steekproef om 200 rijen te krijgen.
- Bekijk de steekproefgegevensset
attrition_samp. Wat valt je op aan de rij-ID's?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# View the attrition_pop dataset
___
# Set the seed
___
attrition_samp <- attrition_pop %>%
# Add a row ID column
___ %>%
# Get 200 rows using simple random sampling
___
# View the attrition_samp dataset
___