1. Apprendre
  2. /
  3. Cours
  4. /
  5. Introduction à la statistique en Python

Connected

Exercice

La moyenne des moyennes

Vous voulez connaître le nombre moyen d'utilisatrices et d'utilisateurs (num_users) par entente, mais vous voulez cette valeur pour l'ensemble de l'entreprise afin de voir si les ententes d'Amir comptent plus ou moins d'utilisateurs que la moyenne des ententes de l'entreprise. Le problème, c'est que, dans la dernière année, l'entreprise a travaillé sur plus de dix mille ententes; il n'est donc pas réaliste de tout compiler. Vous allez plutôt estimer la moyenne en prenant plusieurs échantillons aléatoires d'ententes, ce qui est beaucoup plus simple que de recueillir les données de toute l'entreprise.

amir_deals est disponible et les données d'utilisatrices et d'utilisateurs pour toutes les ententes de l'entreprise sont dans all_deals. pandas sous le nom pd et numpy sous le nom np sont tous deux chargés.

Instructions

100 XP
  • Fixez la graine aléatoire à 321.
  • Prenez 30 échantillons (avec remise) de taille 20 à partir de all_deals['num_users'] et calculez la moyenne de chaque échantillon. Enregistrez ces moyennes dans sample_means.
  • Affichez la moyenne de sample_means.
  • Affichez la moyenne de la colonne num_users de amir_deals.