Bootstrapping vs. normaliteit
Je hebt de resultaten gezien van een bootstrap-betrouwbaarheidsinterval voor Pearson’s R. Maar hoe zit het met veelvoorkomende situaties zoals een betrouwbaarheidsinterval voor een gemiddelde? Waarom zou je een bootstrap-betrouwbaarheidsinterval gebruiken in plaats van een “normaal” betrouwbaarheidsinterval uit stats.norm?
Een DataFrame met investeringen van durfkapitaalbedrijven (investments_df) is voor je geladen, net als de pakketten pandas als pd, NumPy als np en stats uit SciPy.
Deze oefening maakt deel uit van de cursus
Basis van inferentie in Python
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Select just the companies in the Analytics market
analytics_df = ____[____ == 'Analytics']
# Confidence interval using the stats.norm function
norm_ci = stats.norm.____(alpha=____,
loc=____,
scale=____.std() / np.___(____))
# Construct a bootstrapped confidence interval
bootstrap_ci = stats.bootstrap(data=(____, ),
statistic=np.____)
print('Normal CI:', norm_ci)
print('Bootstrap CI:', bootstrap_ci.confidence_interval)