CommencerCommencez gratuitement

Bootstrap vs normalité

Vous avez vu les résultats d’un intervalle de confiance bootstrap pour le R de Pearson. Mais qu’en est-il de situations courantes comme la construction d’un intervalle de confiance pour une moyenne ? Pourquoi choisir un intervalle de confiance bootstrap plutôt qu’un intervalle de confiance « normal » issu de stats.norm ?

Un DataFrame présentant des investissements de sociétés de capital-risque (investments_df) a été chargé pour vous, ainsi que les packages pandas sous pd, NumPy sous np, et stats de SciPy.

Cet exercice fait partie du cours

<cours>Fondements de l’inférence en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Select just the companies in the Analytics market
analytics_df = ____[____ == 'Analytics']

# Confidence interval using the stats.norm function
norm_ci = stats.norm.____(alpha=____,
                         loc=____,
                         scale=____.std() / np.___(____))

# Construct a bootstrapped confidence interval
bootstrap_ci = stats.bootstrap(data=(____, ),
                              statistic=np.____)

print('Normal CI:', norm_ci)
print('Bootstrap CI:', bootstrap_ci.confidence_interval)
Modifier et exécuter le code