IniziaInizia gratis

Intervalli di confidenza di base

Sei un data scientist per un produttore di fuochi d'artificio a Des Moines, Iowa. Devi dimostrare alla città che il grande spettacolo pirotecnico della tua azienda non ha danneggiato l'aria cittadina. Per farlo, osservi i livelli medi degli inquinanti nella settimana successiva al quattro luglio e li confronti con le rilevazioni effettuate dopo il tuo ultimo spettacolo. Mostrando gli intervalli di confidenza attorno alle medie, puoi sostenere che le rilevazioni recenti rientrano ampiamente nell'intervallo normale.

Questi dati sono caricati come average_ests, con una riga per ogni inquinante misurato.

Questo esercizio fa parte del corso

Migliorare le tue visualizzazioni dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Crea i limiti inferiore e superiore dell'intervallo al 95%:

    • Crea il limite inferiore sottraendo 1,96 errori standard ('std_err') dalla 'mean' delle stime.
    • Crea il limite superiore aggiungendo 1,96 errori standard ('std_err') alla 'mean' delle stime.
  • Passa pollutant come variabile di faceting a sns.FacetGrid() e scollega gli assi x dei grafici così che gli intervalli siano ben dimensionati.

  • Passa i limiti di intervallo costruiti alla funzione mappata plt.hlines().

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Construct CI bounds for averages
average_ests['lower'] = average_ests['____'] - 1.96*average_ests['____']
average_ests['upper'] = average_ests['____'] + 1.96*average_ests['____']

# Setup a grid of plots, with non-shared x axes limits
g = sns.FacetGrid(average_ests, row = '____', ____ = False)

# Plot CI for average estimate
g.map(plt.hlines, 'y', '____', '____')

# Plot observed values for comparison and remove axes labels
g.map(plt.scatter, 'seen', 'y', color = 'orangered').set_ylabels('').set_xlabels('') 

plt.show()
Modifica ed esegui il codice