Statistiques d'échantillon versus population
Dans cet exercice, vous allez travailler avec une population préchargée. Vous allez construire un sample en tirant des points au hasard dans la population. Vous calculerez la moyenne et l’écart type de l’échantillon prélevé dans cette population afin de vérifier si l’échantillon est représentatif de la population. L’objectif est de voir si les statistiques de l’échantillon sont identiques ou très proches de celles de la population.

Cet exercice fait partie du cours
Introduction à la modélisation linéaire en Python
Instructions
- Calculez et affichez la moyenne et l’écart type des données
population. - Utilisez la méthode
np.random.seed()pour fixer la graine du générateur pseudo-aléatoire denumpyà42. - Utilisez
np.random.choice()pour créer unsampledesize=31, où size est le nombre de points tirés de lapopulation. - Calculez et affichez la moyenne et l’écart type du
sample, puis comparez les valeurs affichées des statistiques de l’échantillon et de la population pour voir si elles diffèrent.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the population statistics
print("Population mean {:.1f}, stdev {:.2f}".format( population.____(), population.____() ))
# Set random seed for reproducibility
____.____.____(42)
# Construct a sample by randomly sampling 31 points from the population
sample = np.____.____(____, size=31)
# Compare sample statistics to the population statistics
print(" Sample mean {:.1f}, stdev {:.2f}".format( sample.____(), sample.____() ))