La moyenne des moyennes
Vous voulez connaître le nombre moyen d’utilisateurs (champ num_users
) par transaction, mais vous voulez aussi connaître ce nombre pour l’ensemble de l’entreprise afin de voir si les transactions d’Amir ont plus ou moins d’utilisateurs que les transactions moyennes de l’entreprise. Le problème est qu’au cours de l’année écoulée, l’entreprise a travaillé sur plus de dix mille transactions, de sorte qu’il n'est pas réaliste de compiler toutes les données. Au lieu de cela, vous allez estimer la moyenne en prenant plusieurs échantillons aléatoires de transactions, car cela est beaucoup plus facile que de collecter des données auprès de tous les employés de l’entreprise.
Les données des utilisateurs pour toutes les offres de l'entreprise sont disponibles sur all_deals
.
Cet exercice fait partie du cours
Introduction aux statistiques en R
Instructions
- Fixez la graine aléatoire à
321
. - Prélevez 30 échantillons de taille 20 sur
all_deals$num_users
et calculez la moyenne de chaque échantillon. Enregistrez les moyennes des échantillons danssample_means
. - Prenez la moyenne de
sample_means
. - Prenez la moyenne de la colonne
num_users
deamir_deals
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set seed to 321
___
# Take 30 samples of 20 values of num_users, take mean of each sample
sample_means <- ___(___, ___(___, ___) %>% mean())
# Calculate mean of sample_means
___
# Calculate mean of num_users in amir_deals
___