Das Bootstrap-Histogramm
Du planst einen Urlaub nach Cincinnati im Mai, hast aber eine starke Empfindlichkeit gegenüber NO2. Du ziehst einige Jahre an Luftverschmutzungsdaten für Cincinnati im Mai heran und betrachtest eine Bootstrap-Schätzung des durchschnittlichen NO2-Niveaus. Da du nur eine Schätzung hast, ist ein Histogramm die beste Möglichkeit, die Ergebnisse deiner Bootstrap-Schätzungen zu visualisieren.
Während dir das reine Bootstrap-Histogramm intuitiv gefällt, sieht deine Partnerin bzw. dein Partner, mit der bzw. dem du verreist, gern Prozentintervalle. Um dem entgegenzukommen, entscheidest du dich, das 95-%-Intervall durch Schattierung des Bereichs hervorzuheben.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
- Übergebe der Funktion
percentile()die oberen und unteren Perzentile, die für ein 95-%-Intervall benötigt werden. - Schattiere den Hintergrund der Grafik im 95-%-Intervall.
- Zeichne ein Histogramm der Bootstrap-Mittelwerte mit 100 Bins.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
cinci_may_NO2 = pollution.query("city == 'Cincinnati' & month == 5").NO2
# Generate bootstrap samples
boot_means = bootstrap(cinci_may_NO2, 1000)
# Get lower and upper 95% interval bounds
lower, upper = np.percentile(boot_means, [____, ____])
# Plot shaded area for interval
plt.axvspan(____, ____, color = 'gray', alpha = 0.2)
# Draw histogram of bootstrap samples
sns.histplot(____, ____ = 100)
plt.show()