CommencerCommencer gratuitement

La moyenne des moyennes

Vous voulez connaître le nombre moyen d’utilisateurs (champ num_users) par transaction, mais vous voulez aussi connaître ce nombre pour l’ensemble de l’entreprise afin de voir si les transactions d’Amir ont plus ou moins d’utilisateurs que les transactions moyennes de l’entreprise. Le problème est qu’au cours de l’année écoulée, l’entreprise a travaillé sur plus de dix mille transactions, de sorte qu’il n'est pas réaliste de compiler toutes les données. Au lieu de cela, vous allez estimer la moyenne en prenant plusieurs échantillons aléatoires de transactions, car cela est beaucoup plus facile que de collecter des données auprès de tous les employés de l’entreprise.

Les données des utilisateurs pour toutes les offres de l'entreprise sont disponibles sur all_deals.

Cet exercice fait partie du cours

Introduction aux statistiques en R

Afficher le cours

Instructions

  • Fixez la graine aléatoire à 321.
  • Prélevez 30 échantillons de taille 20 sur all_deals$num_users et calculez la moyenne de chaque échantillon. Enregistrez les moyennes des échantillons dans sample_means.
  • Prenez la moyenne de sample_means.
  • Prenez la moyenne de la colonne num_users de amir_deals.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Set seed to 321
___

# Take 30 samples of 20 values of num_users, take mean of each sample
sample_means <- ___(___, ___(___, ___) %>% mean())

# Calculate mean of sample_means
___

# Calculate mean of num_users in amir_deals
___
Modifier et exécuter le code