Tirer des conclusions à partir d’échantillons
Vous avez vu comment l’échantillonnage aléatoire permet de choisir un échantillon de données (espérons-le !) représentatif de la population étudiée. Vous avez aussi constaté comment un biais dans la procédure d’échantillonnage peut mener à des conclusions au mieux douteuses, au pire complètement erronées.
Dans cet exercice, vous allez analyser le cours de clôture moyen du S&P 500. Si vous prenez deux échantillons différents de jours de bourse et calculez un intervalle de confiance pour chacun, devez-vous vous attendre à obtenir le même résultat ? À vous de plonger dedans et de le vérifier !
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Sample 1: Select a random sample of 500 rows
sample_df = ____.sample(n=____)
# Compute a 95% confidence interval for the closing price of SP500
sample_ci = stats.____.____(alpha=____,
loc=____.mean(),
scale=____.std()/np.sqrt(____))
print(sample_ci)