Een betrouwbaarheidsband maken
Vandenberg Air Force Base wordt vaak gebruikt als locatie om raketten de ruimte in te lanceren. Je hebt het vermoeden dat een recente toename in het lanceertempo de luchtkwaliteit in de regio verslechtert. Om dit te onderzoeken heb je een voortschrijdend gemiddelde over 25 dagen geplot van de metingen van atmosferische NO2. Om te bepalen of een eventueel zichtbaar patroon ruis is of niet, besluit je een 99%-betrouwbaarheidsband rondom je voortschrijdend gemiddelde toe te voegen. Een betrouwbaarheidsband aan een trendlijn toevoegen kan inzicht geven in de stabiliteit van de trend. Dit kan het vertrouwen in de gevonden trend juist vergroten of verkleinen.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
- Maak bovenste en onderste 99%-intervalbanden door
2.58standaardfouten bij het gemiddelde op te tellen en ervan af te trekken. - Maak de punt-schattinglijn wit.
- Maak de punt-schattinglijn half transparant door
alphaop0.4te zetten. - Geef aan
plt.fill_between()door tussen welke waarden er per dag gevuld moet worden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Draw 99% inverval bands for average NO2
vandenberg_NO2['lower'] = vandenberg_NO2['mean'] ____ ____*vandenberg_NO2['std_err']
vandenberg_NO2['upper'] = vandenberg_NO2['mean'] ____ ____*vandenberg_NO2['std_err']
# Plot mean estimate as a white semi-transparent line
plt.plot('day', 'mean', data = vandenberg_NO2,
color = '____', alpha = ____)
# Fill between the upper and lower confidence band values
plt.fill_between(x = 'day',
____ = 'lower', ____ = 'upper',
data = vandenberg_NO2)
plt.show()