Intervalos del 90, 95 y 99%
Eres científico de datos en una empresa de aventuras al aire libre en Fairbanks, Alaska. Últimamente, los clientes están teniendo problemas con la contaminación por SO2, lo que provoca cancelaciones costosas. La empresa tiene sensores de CO, NO2 y O3, pero no de niveles de SO2.
Has creado un modelo que predice valores de SO2 a partir de los valores de los contaminantes con sensores (cargado como pollution_model, un objeto de statsmodels). Quieres investigar qué contaminante tiene el mayor efecto en la predicción de SO2 de tu modelo. Esto te ayudará a saber a qué valores de contaminantes prestar más atención al planificar las excursiones. Para maximizar la información en tu informe, muestra varios niveles de incertidumbre para las estimaciones del modelo.
Este ejercicio forma parte del curso
Mejora tus visualizaciones de datos en Python
Instrucciones del ejercicio
- Rellena los porcentajes de anchura de intervalo adecuados (entre 90, 95 y 99%) según la lista de valores en
alpha. - En el bucle for, colorea el intervalo con su
colorasignado. - Pasa el valor de porcentaje
widthdel bucle aplt.hlines()para etiquetar la leyenda.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Add interval percent widths
alphas = [ 0.01, 0.05, 0.1]
widths = [ '__% CI', '__%', '__%']
colors = ['#fee08b','#fc8d59','#d53e4f']
for alpha, color, width in zip(alphas, colors, widths):
# Grab confidence interval
conf_ints = pollution_model.conf_int(alpha)
# Pass current interval color and legend label to plot
plt.hlines(y = conf_ints.index, xmin = conf_ints[0], xmax = conf_ints[1],
colors = ____, ____ = width, linewidth = 10)
# Draw point estimates
plt.plot(pollution_model.params, pollution_model.params.index, 'wo', label = 'Point Estimate')
plt.legend()
plt.show()