Bootstrap vs normalité
Vous avez vu les résultats d’un intervalle de confiance bootstrap pour le R de Pearson. Mais qu’en est-il de situations courantes comme la construction d’un intervalle de confiance pour une moyenne ? Pourquoi choisir un intervalle de confiance bootstrap plutôt qu’un intervalle de confiance « normal » issu de stats.norm ?
Un DataFrame présentant des investissements de sociétés de capital-risque (investments_df) a été chargé pour vous, ainsi que les packages pandas sous pd, NumPy sous np, et stats de SciPy.
Cet exercice fait partie du cours
Fondements de l’inférence en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Select just the companies in the Analytics market
analytics_df = ____[____ == 'Analytics']
# Confidence interval using the stats.norm function
norm_ci = stats.norm.____(alpha=____,
loc=____,
scale=____.std() / np.___(____))
# Construct a bootstrapped confidence interval
bootstrap_ci = stats.bootstrap(data=(____, ),
statistic=np.____)
print('Normal CI:', norm_ci)
print('Bootstrap CI:', bootstrap_ci.confidence_interval)