Intervalli al 90, 95 e 99%
Sei un data scientist per un'azienda di avventure all'aperto a Fairbanks, in Alaska. Di recente, i clienti hanno avuto problemi con l'inquinamento da SO2, causando costose cancellazioni. L'azienda ha sensori per CO, NO2 e O3 ma non per i livelli di SO2.
Hai creato un modello che predice i valori di SO2 in base ai valori degli inquinanti con sensori (caricato come pollution_model, un oggetto statsmodels). Vuoi capire quale inquinante ha l'effetto maggiore sulla previsione di SO2 del tuo modello. Questo ti aiuterà a sapere a quali valori prestare più attenzione quando pianifichi i tour all'aperto. Per massimizzare le informazioni nel tuo report, mostra più livelli di incertezza per le stime del modello.
Questo esercizio fa parte del corso
Migliorare le tue visualizzazioni dei dati in Python
Istruzioni dell'esercizio
- Compila le percentuali corrette della larghezza degli intervalli (tra 90, 95 e 99%) in base ai valori dell'elenco
alpha. - Nel ciclo for, colora l'intervallo con il suo
colorassegnato. - Passa il valore di percentuale
widthdel ciclo aplt.hlines()per etichettare la legenda.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Add interval percent widths
alphas = [ 0.01, 0.05, 0.1]
widths = [ '__% CI', '__%', '__%']
colors = ['#fee08b','#fc8d59','#d53e4f']
for alpha, color, width in zip(alphas, colors, widths):
# Grab confidence interval
conf_ints = pollution_model.conf_int(alpha)
# Pass current interval color and legend label to plot
plt.hlines(y = conf_ints.index, xmin = conf_ints[0], xmax = conf_ints[1],
colors = ____, ____ = width, linewidth = 10)
# Draw point estimates
plt.plot(pollution_model.params, pollution_model.params.index, 'wo', label = 'Point Estimate')
plt.legend()
plt.show()