Distributions d’échantillonnage normales
Vous souhaitez estimer une moyenne réaliste du cours de clôture du S&P 500 sur un sous-ensemble de son historique de cotation. Cela ressemble à un cas d’usage naturel d’un intervalle de confiance, puisque vous disposez d’une statistique d’échantillon et voulez l’utiliser pour estimer une statistique de population. Toutefois, la première étape consiste à vérifier si la distribution d’échantillonnage est approximativement normale. Dans cet exercice, vous allez faire exactement cela. Dans le suivant, vous utiliserez ce résultat pour construire votre intervalle de confiance.
Les mêmes données btc_sp_df ont été chargées pour vous, ainsi que les packages pandas sous pd, NumPy sous np et Matplotlib sous plt.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Instructions
- Définissez une variable
num_samplescomme le nombre d’échantillons souhaité (200), et définissez une liste videsample_meanspour stocker la moyenne de chacun des 200 échantillons. - Écrivez une boucle
forqui répétera le processus d’échantillonnagenum_samplesfois. - Sélectionnez 500 cours de clôture du S&P 500 au hasard depuis la colonne
Close_SP500debtc_sp_df. - Calculez la moyenne de chacun de ces échantillons et stockez-les dans
sample_means.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define the number of samples to take and store the sample means
num_samples = ____
sample_means = ____
# Write a for loop which repeats the sampling num_samples times
for i in ____:
# Select 500 random Close_SP500 prices
sp500_sample = np.___(____, size=____)
# Compute mean closing price and save it to sample_means
____.append(____.mean())
plt.hist(sample_means)
plt.show()