Eine Konfidenzband erstellen
Die Vandenberg Air Force Base wird häufig als Standort für Raketenstarts ins All genutzt. Du vermutest, dass der jüngste Anstieg der Startfrequenz die Luftqualität in der umliegenden Region beeinträchtigen könnte. Um das zu untersuchen, hast du eine 25-Tage-Gleitdurchschnittslinie für die Messungen des atmosphärischen NO2 gezeichnet. Um besser einschätzen zu können, ob ein beobachtetes Muster Zufallsrauschen ist oder nicht, fügst du ein 99-%-Konfidenzband um deinen gleitenden Mittelwert hinzu. Ein Konfidenzband an einer Trendlinie kann Aufschluss über die Stabilität des sichtbaren Trends geben. Das kann das Vertrauen in den gefundenen Trend entweder erhöhen oder verringern.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
- Konstruiere obere und untere 99-%-Intervallbänder, indem du
2.58Standardfehler zum Mittelwert addierst bzw. davon subtrahierst. - Mach die Punkt-Schätzer-Linie weiß.
- Mach die Punkt-Schätzer-Linie halbtransparent, indem du
alphaauf0.4setzt. - Gib
plt.fill_between()an, zwischen welchen Werten für jeden Tag gefüllt werden soll.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Draw 99% inverval bands for average NO2
vandenberg_NO2['lower'] = vandenberg_NO2['mean'] ____ ____*vandenberg_NO2['std_err']
vandenberg_NO2['upper'] = vandenberg_NO2['mean'] ____ ____*vandenberg_NO2['std_err']
# Plot mean estimate as a white semi-transparent line
plt.plot('day', 'mean', data = vandenberg_NO2,
color = '____', alpha = ____)
# Fill between the upper and lower confidence band values
plt.fill_between(x = 'day',
____ = 'lower', ____ = 'upper',
data = vandenberg_NO2)
plt.show()