CommencerCommencer gratuitement

Variation des statistiques d’échantillon

Si nous créons un échantillon de size=1000 en tirant autant de points d’une population, puis que nous calculons une statistique d’échantillon, comme la moyenne, nous obtenons une valeur unique qui résume l’échantillon.

Si vous répétez ce processus d’échantillonnage num_samples=100 fois, vous obtenez 100 échantillons. Calculer la statistique d’échantillon, par exemple la moyenne, pour chacun des différents échantillons produit une distribution des valeurs de la moyenne. L’objectif est alors de calculer la moyenne des moyennes et l’écart type des moyennes.

Ici, vous utiliserez les variables préchargées population, num_samples et num_pts. Notez que les tableaux means et deviations ont été initialisés à zéro ; ils vous servent de conteneurs à utiliser dans la boucle for.

Cet exercice fait partie du cours

Introduction à la modélisation linéaire en Python

Afficher le cours

Instructions

  • Pour chacune des num_samples=100 itérations, générez un échantillon, puis calculez et stockez ses statistiques.
  • À chaque itération, créez un sample en utilisant np.random.choice() pour tirer 1000 points aléatoires de la population.
  • À chaque itération, calculez et stockez sample.mean() et sample.std() pour obtenir la moyenne et l’écart type de l’échantillon.
  • Pour le tableau means et le tableau deviations, calculez la moyenne et l’écart type de chacun, puis affichez les résultats.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize two arrays of zeros to be used as containers
means = np.zeros(num_samples)
stdevs = np.zeros(num_samples)

# For each iteration, compute and store the sample mean and sample stdev
for ns in range(num_samples):
    sample = np.____.choice(population, num_pts)
    means[ns] = sample.____()
    stdevs[ns] = sample.____()

# Compute and print the mean() and std() for the sample statistic distributions
print("Means:  center={:>6.2f}, spread={:>6.2f}".format(means.mean(), means.std()))
print("Stdevs: center={:>6.2f}, spread={:>6.2f}".format(stdevs.____(), stdevs.____()))
Modifier et exécuter le code