Intervalli di confidenza di base
Sei un data scientist per un produttore di fuochi d'artificio a Des Moines, Iowa. Devi dimostrare alla città che il grande spettacolo pirotecnico della tua azienda non ha danneggiato l'aria cittadina. Per farlo, osservi i livelli medi degli inquinanti nella settimana successiva al quattro luglio e li confronti con le rilevazioni effettuate dopo il tuo ultimo spettacolo. Mostrando gli intervalli di confidenza attorno alle medie, puoi sostenere che le rilevazioni recenti rientrano ampiamente nell'intervallo normale.
Questi dati sono caricati come average_ests, con una riga per ogni inquinante misurato.
Questo esercizio fa parte del corso
Migliorare le tue visualizzazioni dei dati in Python
Istruzioni dell'esercizio
Crea i limiti inferiore e superiore dell'intervallo al 95%:
- Crea il limite inferiore sottraendo 1,96 errori standard (
'std_err') dalla'mean'delle stime. - Crea il limite superiore aggiungendo 1,96 errori standard (
'std_err') alla'mean'delle stime.
- Crea il limite inferiore sottraendo 1,96 errori standard (
Passa
pollutantcome variabile di faceting asns.FacetGrid()e scollega gli assi x dei grafici così che gli intervalli siano ben dimensionati.Passa i limiti di intervallo costruiti alla funzione mappata
plt.hlines().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Construct CI bounds for averages
average_ests['lower'] = average_ests['____'] - 1.96*average_ests['____']
average_ests['upper'] = average_ests['____'] + 1.96*average_ests['____']
# Setup a grid of plots, with non-shared x axes limits
g = sns.FacetGrid(average_ests, row = '____', ____ = False)
# Plot CI for average estimate
g.map(plt.hlines, 'y', '____', '____')
# Plot observed values for comparison and remove axes labels
g.map(plt.scatter, 'seen', 'y', color = 'orangered').set_ylabels('').set_xlabels('')
plt.show()