Aan de slagGa gratis aan de slag

Bootstrapping vs. normaliteit

Je hebt de resultaten gezien van een bootstrap-betrouwbaarheidsinterval voor Pearson’s R. Maar hoe zit het met veelvoorkomende situaties zoals een betrouwbaarheidsinterval voor een gemiddelde? Waarom zou je een bootstrap-betrouwbaarheidsinterval gebruiken in plaats van een “normaal” betrouwbaarheidsinterval uit stats.norm?

Een DataFrame met investeringen van durfkapitaalbedrijven (investments_df) is voor je geladen, net als de pakketten pandas als pd, NumPy als np en stats uit SciPy.

Deze oefening maakt deel uit van de cursus

Basis van inferentie in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Select just the companies in the Analytics market
analytics_df = ____[____ == 'Analytics']

# Confidence interval using the stats.norm function
norm_ci = stats.norm.____(alpha=____,
                         loc=____,
                         scale=____.std() / np.___(____))

# Construct a bootstrapped confidence interval
bootstrap_ci = stats.bootstrap(data=(____, ),
                              statistic=np.____)

print('Normal CI:', norm_ci)
print('Bootstrap CI:', bootstrap_ci.confidence_interval)
Code bewerken en uitvoeren