Intervalos de confianza básicos

Eres científico de datos en un fabricante de fuegos artificiales en Des Moines, Iowa. Necesitas demostrar a la ciudad que el gran espectáculo de tu empresa no ha perjudicado la calidad del aire. Para ello, analizas los niveles promedio de contaminantes en la semana posterior al 4 de julio y los comparas con las mediciones tomadas tras tu último espectáculo. Si muestras intervalos de confianza alrededor de los promedios, podrás argumentar que las lecturas recientes están dentro del rango normal.

Estos datos están cargados como average_ests, con una fila por cada contaminante medido.

Este ejercicio forma parte del curso

Mejora tus visualizaciones de datos en Python

Ver curso

Instrucciones del ejercicio

Crea los límites inferior y superior del intervalo al 95%:
- Crea el límite inferior restando 1.96 errores estándar ('std_err') a la 'mean' de las estimaciones.
- Crea el límite superior sumando 1.96 errores estándar ('std_err') a la 'mean' de las estimaciones.
Pasa pollutant como variable de facetado a sns.FacetGrid() y desliga los ejes x de las gráficas para que los intervalos queden bien dimensionados.
Pasa los límites del intervalo que has construido a la función mapeada plt.hlines().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Construct CI bounds for averages
average_ests['lower'] = average_ests['____'] - 1.96*average_ests['____']
average_ests['upper'] = average_ests['____'] + 1.96*average_ests['____']

# Setup a grid of plots, with non-shared x axes limits
g = sns.FacetGrid(average_ests, row = '____', ____ = False)

# Plot CI for average estimate
g.map(plt.hlines, 'y', '____', '____')

# Plot observed values for comparison and remove axes labels
g.map(plt.scatter, 'seen', 'y', color = 'orangered').set_ylabels('').set_xlabels('') 

plt.show()

Editar y ejecutar código