La moyenne des moyennes

Vous voulez connaître le nombre moyen d’utilisateurs (champ num_users) par transaction, mais vous voulez aussi connaître ce nombre pour l’ensemble de l’entreprise afin de voir si les transactions d’Amir ont plus ou moins d’utilisateurs que les transactions moyennes de l’entreprise. Le problème est qu’au cours de l’année écoulée, l’entreprise a travaillé sur plus de dix mille transactions, de sorte qu’il n'est pas réaliste de compiler toutes les données. Au lieu de cela, vous allez estimer la moyenne en prenant plusieurs échantillons aléatoires de transactions, car cela est beaucoup plus facile que de collecter des données auprès de tous les employés de l’entreprise.

amir_deals est disponible et les données des utilisateurs pour toutes les transactions de l’entreprise sont disponibles dans all_deals. pandas est chargé en tant que pd et numpy en tant que np.

Cet exercice fait partie du cours

<cours>Introduction aux statistiques en Python</cours>

Instructions de l’exercice

Fixez la graine aléatoire à 321.
Prélevez 30 échantillons (avec remise) de taille 20 sur all_deals['num_users'] et calculez la moyenne de chaque échantillon. Enregistrez les moyennes des échantillons dans sample_means.
Imprimez la moyenne de sample_means.
Imprimez la moyenne de la colonne num_users de amir_deals.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Set seed to 321
____

sample_means = []
# Loop 30 times to take 30 means
for i in range(____):
  # Take sample of size 20 from num_users col of all_deals with replacement
  cur_sample = ____
  # Take mean of cur_sample
  cur_mean = ____
  # Append cur_mean to sample_means
  sample_means.append(____)

# Print mean of sample_means
print(____)

# Print mean of num_users in amir_deals
print(____)

Modifier et exécuter le code

Cet exercice fait partie du cours

<cours>Introduction aux statistiques en Python</cours>

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Les statistiques récapitulatives vous fournissent les outils dont vous avez besoin pour résumer des ensembles de données volumineux et en révéler les points importants. Dans ce chapitre, vous explorerez les statistiques récapitulatives, notamment la moyenne, la médiane et l’écart-type, et apprendrez à les interpréter avec précision. Vous développerez également votre esprit critique, ce qui vous permettra de choisir les meilleures statistiques récapitulatives pour vos données.

Exercise 1: Les statistiques, qu’est-ce que c’est ?Exercise 2: Statistiques descriptives et inférentielles Exercise 3: Classification des types de données Exercise 4: Mesures du centre Exercise 5: Calcul de la moyenne et de la médiane Exercise 6: Moyenne, médiane et forme de la distribution Exercise 7: Mesures de dispersion Exercise 8: Variance et écart-type Exercise 9: Quartiles, quantiles et quintiles Exercise 10: Recherche de valeurs aberrantes à l’aide de l’IQR

Dans ce chapitre, vous apprendrez à générer des échantillons aléatoires et à mesurer le hasard à l’aide des probabilités. Vous travaillerez avec des données de vente réelles pour calculer la probabilité de réussite d’un vendeur. Enfin, vous utiliserez la distribution binomiale pour modéliser des événements à résultats binaires.

Exercise 1: Quelles sont les chances ?Exercise 2: Avec ou sans remise ?Exercise 3: Calcul de probabilités Exercise 4: Échantillonnage de transactions Exercise 5: Distributions discrètes Exercise 6: Créer une distribution de probabilités Exercise 7: Identifier des distributions Exercise 8: Valeur attendue par rapport à la moyenne de l’échantillon Exercise 9: Distributions continues Exercise 10: Quelle distribution ?Exercise 11: Sauvegardes de données Exercise 12: Simulation de temps d’attente Exercise 13: La distribution binomiale Exercise 14: Simulation de transactions de ventes Exercise 15: Calcul de probabilités binomiales Exercise 16: Combien de ventes seront réalisées ?

Il est temps d’explorer l’une des distributions de probabilités les plus importantes en statistiques, la distribution normale. Vous allez créer des histogrammes pour représenter des distributions normales et comprendre le théorème de la limite centrale, avant d’élargir votre connaissance des fonctions statistiques en ajoutant les distributions de Poisson, exponentielle et t à votre répertoire.

Exercise 1: La distribution normale Exercise 2: Distribution des ventes d’Amir Exercise 3: Probabilités de la distribution normale Exercise 4: Simuler des ventes dans de nouvelles conditions de marché Exercise 5: Quel est le meilleur marché ?Exercise 6: Le théorème de la limite centrale (CLT)Exercise 7: Visualisation des distributions d’échantillonnage Exercise 8: Le théorème de la limite centrale en action Exercise 9: La moyenne des moyennes

Exercice actuel

Exercise 10: La distribution de Poisson Exercise 11: Identifier lambda Exercise 12: Suivi des réponses aux prospects Exercise 13: Plus de distributions de probabilités Exercise 14: Identifier les distributions Exercise 15: Modélisation du temps entre les prospects Exercise 16: La distribution t

Dans ce chapitre, vous apprendrez à quantifier la force d’une relation linéaire entre deux variables et vous explorerez la façon dont les variables confusionnelles peuvent affecter la relation entre deux autres variables. Vous verrez également comment la conception d’une étude peut influencer ses résultats, modifier la façon dont les données doivent être analysées et potentiellement affecter la fiabilité de vos conclusions.

Exercise 1: Corrélation Exercise 2: Devinez la corrélation Exercise 3: Relations entre les variables Exercise 4: Mises en garde sur les corrélations Exercise 5: Qu’est-ce que la corrélation ne peut pas mesurer ?Exercise 6: Transformer des variables Exercise 7: Le sucre améliore-t-il le bonheur ?Exercise 8: Facteurs de confusion Exercise 9: Plan d’expériences Exercise 10: Types d’études Exercise 11: Études longitudinales ou transversales ?Exercise 12: Félicitations !