Bootstrap vs normalité
Vous avez vu les résultats d’un intervalle de confiance bootstrap pour le R de Pearson. Mais qu’en est-il de situations courantes comme la construction d’un intervalle de confiance pour une moyenne ? Pourquoi choisir un intervalle de confiance bootstrap plutôt qu’un intervalle de confiance « normal » issu de stats.norm ?
Un DataFrame présentant des investissements de sociétés de capital-risque (investments_df) a été chargé pour vous, ainsi que les packages pandas sous pd, NumPy sous np, et stats de SciPy.
Cet exercice fait partie du cours
<cours>Fondements de l’inférence en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Select just the companies in the Analytics market
analytics_df = ____[____ == 'Analytics']
# Confidence interval using the stats.norm function
norm_ci = stats.norm.____(alpha=____,
loc=____,
scale=____.std() / np.___(____))
# Construct a bootstrapped confidence interval
bootstrap_ci = stats.bootstrap(data=(____, ),
statistic=np.____)
print('Normal CI:', norm_ci)
print('Bootstrap CI:', bootstrap_ci.confidence_interval)