Het gemiddelde van gemiddelden
Je wilt weten wat het gemiddelde aantal gebruikers (num_users) per deal is, maar je wilt dit weten voor het hele bedrijf zodat je kunt zien of Amirs deals meer of minder gebruikers hebben dan de gemiddelde deal van het bedrijf. Het probleem is dat het bedrijf het afgelopen jaar aan meer dan tienduizend deals heeft gewerkt, dus het is niet realistisch om alle data te verzamelen. In plaats daarvan schat je het gemiddelde door meerdere willekeurige steekproeven van deals te nemen, omdat dit veel makkelijker is dan gegevens van iedereen in het bedrijf verzamelen.
De gebruikersdata voor alle deals van het bedrijf is beschikbaar in all_deals.
Deze oefening maakt deel uit van de cursus
Inleiding tot statistiek in R
Oefeninstructies
- Zet de random seed op
321. - Neem 30 steekproeven van grootte 20 uit
all_deals$num_usersen bereken het gemiddelde van elke steekproef. Sla de steekproefgemiddelden op insample_means. - Neem het gemiddelde van
sample_means. - Neem het gemiddelde van de kolom
num_usersvanamir_deals.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Set seed to 321
___
# Take 30 samples of 20 values of num_users, take mean of each sample
sample_means <- ___(___, ___(___, ___) %>% mean())
# Calculate mean of sample_means
___
# Calculate mean of num_users in amir_deals
___