Grundlegende Konfidenzintervalle
Du bist Data Scientist bei einem Feuerwerkshersteller in Des Moines, Iowa. Du musst der Stadt darlegen, dass das große Feuerwerk deines Unternehmens der Luftqualität nicht geschadet hat. Dafür betrachtest du die durchschnittlichen Werte für Schadstoffe in der Woche nach dem 4. Juli und vergleichst sie mit Messungen nach deiner letzten Show. Indem du Konfidenzintervalle um die Mittelwerte zeigst, kannst du belegen, dass die aktuellen Messungen klar im normalen Bereich lagen.
Diese Daten sind als average_ests geladen, mit einer Zeile pro gemessenem Schadstoff.
Diese Übung ist Teil des Kurses
So verbesserst du deine Datenvisualisierungen in Python
Anleitung zur Übung
Erstelle die unteren und oberen Grenzen des 95-%-Intervalls:
- Erzeuge die untere Grenze, indem du 1,96 Standardfehler (
'std_err') vom'mean'der Schätzungen subtrahierst. - Erzeuge die obere Grenze, indem du 1,96 Standardfehler (
'std_err') zum'mean'der Schätzungen addierst.
- Erzeuge die untere Grenze, indem du 1,96 Standardfehler (
Übergib
pollutantals Facettierungsvariable ansns.FacetGrid()und entkopple die x-Achsen der Plots, damit die Intervalle gut skaliert sind.Übergib die konstruierten Intervallgrenzen an die gemappte Funktion
plt.hlines().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Construct CI bounds for averages
average_ests['lower'] = average_ests['____'] - 1.96*average_ests['____']
average_ests['upper'] = average_ests['____'] + 1.96*average_ests['____']
# Setup a grid of plots, with non-shared x axes limits
g = sns.FacetGrid(average_ests, row = '____', ____ = False)
# Plot CI for average estimate
g.map(plt.hlines, 'y', '____', '____')
# Plot observed values for comparison and remove axes labels
g.map(plt.scatter, 'seen', 'y', color = 'orangered').set_ylabels('').set_xlabels('')
plt.show()