Aan de slagGa gratis aan de slag

Het bootstrap-histogram

Je overweegt in mei op vakantie te gaan naar Cincinnati, maar je bent erg gevoelig voor NO2. Je haalt een paar jaar aan vervuilingsdata op voor Cincinnati in mei en bekijkt een bootstrapschatting van de gemiddelde NO2-niveaus. Je hebt maar één schatting, dus de beste manier om de resultaten van je bootstrapschattingen te visualiseren is met een histogram.

Hoewel jij de intuïtie van het bootstrap-histogram op zichzelf prettig vindt, ziet je partner — met wie je op vakantie gaat — graag percentielintervallen. Om daaraan tegemoet te komen, besluit je het 95%-interval te markeren door het gebied te arceren.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Geef de percentile()-functie de onderste en bovenste percentielen om een 95%-interval te krijgen.
  • Kleur de achtergrond van de plot in binnen het 95%-interval.
  • Teken een histogram van de bootstrapgemiddelden met 100 bins.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

cinci_may_NO2 = pollution.query("city  ==  'Cincinnati' & month  ==  5").NO2

# Generate bootstrap samples
boot_means = bootstrap(cinci_may_NO2, 1000)

# Get lower and upper 95% interval bounds
lower, upper = np.percentile(boot_means, [____, ____])

# Plot shaded area for interval
plt.axvspan(____, ____, color = 'gray', alpha = 0.2)

# Draw histogram of bootstrap samples
sns.histplot(____, ____ = 100)

plt.show()
Code bewerken en uitvoeren