IniziaInizia gratis

Annotare gli intervalli di confidenza

Il tuo lavoro di data science sui dati dell'inquinamento è leggendario e ora stai valutando offerte di lavoro a Cincinnati, Ohio, e a Indianapolis, Indiana. Vuoi capire se i livelli di SO2 sono significativamente diversi tra le due città e, più nello specifico, quale città ha livelli più bassi. Per verificarlo, decidi di osservare le differenze nei valori di SO2 delle due città (Indianapolis - Cincinnati) su più anni (fornite come diffs_by_year).

Invece di mostrare solo un p-value per una differenza significativa tra le città, decidi di esaminare gli intervalli di confidenza al 95% (colonne lower e upper) delle differenze. Questo ti permette di vedere l'entità delle differenze insieme a eventuali tendenze nel corso degli anni.

Questo esercizio fa parte del corso

Migliorare le tue visualizzazioni dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Fornisci a plt.hlines() i limiti iniziale e finale (colonne lower e upper) per i tuoi intervalli di confidenza.
  • Imposta lo spessore dell'intervallo a 5.
  • Disegna una linea verticale che rappresenti una differenza di 0 con plt.axvline().
  • Colora la linea nulla di 'orangered' per farla risaltare.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Set start and ends according to intervals 
# Make intervals thicker
plt.hlines(y = 'year', xmin = '____', xmax = '____', 
           linewidth = ____, color = 'steelblue', alpha = 0.7,
           data = diffs_by_year)
# Point estimates
plt.plot('mean', 'year', 'k|', data = diffs_by_year)

# Add a 'null' reference line at 0 and color orangered
plt.axvline(x = ____, color = '____', linestyle = '--')

# Set descriptive axis labels and title
plt.xlabel('95% CI')
plt.title('Avg SO2 differences between Cincinnati and Indianapolis')
plt.show()
Modifica ed esegui il codice