IniziaInizia gratis

Intervalli al 90, 95 e 99%

Sei un data scientist per un'azienda di avventure all'aperto a Fairbanks, in Alaska. Di recente, i clienti hanno avuto problemi con l'inquinamento da SO2, causando costose cancellazioni. L'azienda ha sensori per CO, NO2 e O3 ma non per i livelli di SO2.

Hai creato un modello che predice i valori di SO2 in base ai valori degli inquinanti con sensori (caricato come pollution_model, un oggetto statsmodels). Vuoi capire quale inquinante ha l'effetto maggiore sulla previsione di SO2 del tuo modello. Questo ti aiuterà a sapere a quali valori prestare più attenzione quando pianifichi i tour all'aperto. Per massimizzare le informazioni nel tuo report, mostra più livelli di incertezza per le stime del modello.

Questo esercizio fa parte del corso

Migliorare le tue visualizzazioni dei dati in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Compila le percentuali corrette della larghezza degli intervalli (tra 90, 95 e 99%) in base ai valori dell'elenco alpha.
  • Nel ciclo for, colora l'intervallo con il suo color assegnato.
  • Passa il valore di percentuale width del ciclo a plt.hlines() per etichettare la legenda.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Add interval percent widths
alphas = [     0.01,  0.05,   0.1] 
widths = [ '__% CI', '__%', '__%']
colors = ['#fee08b','#fc8d59','#d53e4f']

for alpha, color, width in zip(alphas, colors, widths):
    # Grab confidence interval
    conf_ints = pollution_model.conf_int(alpha)
    
    # Pass current interval color and legend label to plot
    plt.hlines(y = conf_ints.index, xmin = conf_ints[0], xmax = conf_ints[1],
               colors = ____, ____ = width, linewidth = 10) 

# Draw point estimates
plt.plot(pollution_model.params, pollution_model.params.index, 'wo', label = 'Point Estimate')

plt.legend()
plt.show() 
Modifica ed esegui il codice