CommencerCommencer gratuitement

Statistiques d'échantillon versus population

Dans cet exercice, vous allez travailler avec une population préchargée. Vous allez construire un sample en tirant des points au hasard dans la population. Vous calculerez la moyenne et l’écart type de l’échantillon prélevé dans cette population afin de vérifier si l’échantillon est représentatif de la population. L’objectif est de voir si les statistiques de l’échantillon sont identiques ou très proches de celles de la population.

Cet exercice fait partie du cours

Introduction à la modélisation linéaire en Python

Afficher le cours

Instructions

  • Calculez et affichez la moyenne et l’écart type des données population.
  • Utilisez la méthode np.random.seed() pour fixer la graine du générateur pseudo-aléatoire de numpy à 42.
  • Utilisez np.random.choice() pour créer un sample de size=31, où size est le nombre de points tirés de la population.
  • Calculez et affichez la moyenne et l’écart type du sample, puis comparez les valeurs affichées des statistiques de l’échantillon et de la population pour voir si elles diffèrent.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the population statistics
print("Population mean {:.1f}, stdev {:.2f}".format( population.____(), population.____() ))

# Set random seed for reproducibility
____.____.____(42)

# Construct a sample by randomly sampling 31 points from the population
sample = np.____.____(____, size=31)

# Compare sample statistics to the population statistics
print("    Sample mean {:.1f}, stdev {:.2f}".format( sample.____(), sample.____() ))
Modifier et exécuter le code