CommencerCommencer gratuitement

Distributions d’échantillonnage normales

Vous souhaitez estimer une moyenne réaliste du cours de clôture du S&P 500 sur un sous-ensemble de son historique de cotation. Cela ressemble à un cas d’usage naturel d’un intervalle de confiance, puisque vous disposez d’une statistique d’échantillon et voulez l’utiliser pour estimer une statistique de population. Toutefois, la première étape consiste à vérifier si la distribution d’échantillonnage est approximativement normale. Dans cet exercice, vous allez faire exactement cela. Dans le suivant, vous utiliserez ce résultat pour construire votre intervalle de confiance.

Les mêmes données btc_sp_df ont été chargées pour vous, ainsi que les packages pandas sous pd, NumPy sous np et Matplotlib sous plt.

Cet exercice fait partie du cours

Fondements de l’inférence en Python

Afficher le cours

Instructions

  • Définissez une variable num_samples comme le nombre d’échantillons souhaité (200), et définissez une liste vide sample_means pour stocker la moyenne de chacun des 200 échantillons.
  • Écrivez une boucle for qui répétera le processus d’échantillonnage num_samples fois.
  • Sélectionnez 500 cours de clôture du S&P 500 au hasard depuis la colonne Close_SP500 de btc_sp_df.
  • Calculez la moyenne de chacun de ces échantillons et stockez-les dans sample_means.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Define the number of samples to take and store the sample means
num_samples = ____
sample_means = ____

# Write a for loop which repeats the sampling num_samples times
for i in ____:
  # Select 500 random Close_SP500 prices 
  sp500_sample = np.___(____, size=____)
  # Compute mean closing price and save it to sample_means
  ____.append(____.mean())
    
plt.hist(sample_means)
plt.show()
Modifier et exécuter le code