Samenvattende statistieken voor verschillende soorten steekproeven
Je hebt nu drie soorten steekproeven (eenvoudig, gestratificeerd, cluster). Daarmee kun je puntschattingen uit elke steekproef vergelijken met de populatieparameter. Met andere woorden: bereken dezelfde samenvattende statistiek voor elke steekproef en kijk hoe die zich verhoudt tot de statistiek voor de populatie.
Hier bekijken we hoe tevredenheid met het bedrijf beïnvloedt of een medewerker het bedrijf verlaat. Je berekent dus het aandeel medewerkers dat het bedrijf heeft verlaten (zij hebben Attrition met waarde "Yes"), voor elke waarde van RelationshipSatisfaction.
attrition_pop, attrition_srs, attrition_strat en attrition_clust zijn beschikbaar; dplyr is geladen.
Deze oefening maakt deel uit van de cursus
Steekproeven in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Use the whole population dataset
mean_attrition_pop <- ___ %>%
# Group by relationship satisfaction level
___ %>%
# Calculate the proportion of employee attrition
___
# See the result
mean_attrition_pop