LoslegenKostenlos loslegen

Grundlegende Konfidenzintervalle

Du bist Data Scientist bei einem Feuerwerkshersteller in Des Moines, Iowa. Du musst der Stadt darlegen, dass das große Feuerwerk deines Unternehmens der Luftqualität nicht geschadet hat. Dafür betrachtest du die durchschnittlichen Werte für Schadstoffe in der Woche nach dem 4. Juli und vergleichst sie mit Messungen nach deiner letzten Show. Indem du Konfidenzintervalle um die Mittelwerte zeigst, kannst du belegen, dass die aktuellen Messungen klar im normalen Bereich lagen.

Diese Daten sind als average_ests geladen, mit einer Zeile pro gemessenem Schadstoff.

Diese Übung ist Teil des Kurses

So verbesserst du deine Datenvisualisierungen in Python

Kurs anzeigen

Anleitung zur Übung

  • Erstelle die unteren und oberen Grenzen des 95-%-Intervalls:

    • Erzeuge die untere Grenze, indem du 1,96 Standardfehler ('std_err') vom 'mean' der Schätzungen subtrahierst.
    • Erzeuge die obere Grenze, indem du 1,96 Standardfehler ('std_err') zum 'mean' der Schätzungen addierst.
  • Übergib pollutant als Facettierungsvariable an sns.FacetGrid() und entkopple die x-Achsen der Plots, damit die Intervalle gut skaliert sind.

  • Übergib die konstruierten Intervallgrenzen an die gemappte Funktion plt.hlines().

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Construct CI bounds for averages
average_ests['lower'] = average_ests['____'] - 1.96*average_ests['____']
average_ests['upper'] = average_ests['____'] + 1.96*average_ests['____']

# Setup a grid of plots, with non-shared x axes limits
g = sns.FacetGrid(average_ests, row = '____', ____ = False)

# Plot CI for average estimate
g.map(plt.hlines, 'y', '____', '____')

# Plot observed values for comparison and remove axes labels
g.map(plt.scatter, 'seen', 'y', color = 'orangered').set_ylabels('').set_xlabels('') 

plt.show()
Code bearbeiten und ausführen