Intervalos de confianza básicos
Eres científico de datos en un fabricante de fuegos artificiales en Des Moines, Iowa. Necesitas demostrar a la ciudad que el gran espectáculo de tu empresa no ha perjudicado la calidad del aire. Para ello, analizas los niveles promedio de contaminantes en la semana posterior al 4 de julio y los comparas con las mediciones tomadas tras tu último espectáculo. Si muestras intervalos de confianza alrededor de los promedios, podrás argumentar que las lecturas recientes están dentro del rango normal.
Estos datos están cargados como average_ests, con una fila por cada contaminante medido.
Este ejercicio forma parte del curso
Mejora tus visualizaciones de datos en Python
Instrucciones del ejercicio
Crea los límites inferior y superior del intervalo al 95%:
- Crea el límite inferior restando 1.96 errores estándar (
'std_err') a la'mean'de las estimaciones. - Crea el límite superior sumando 1.96 errores estándar (
'std_err') a la'mean'de las estimaciones.
- Crea el límite inferior restando 1.96 errores estándar (
Pasa
pollutantcomo variable de facetado asns.FacetGrid()y desliga los ejes x de las gráficas para que los intervalos queden bien dimensionados.Pasa los límites del intervalo que has construido a la función mapeada
plt.hlines().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Construct CI bounds for averages
average_ests['lower'] = average_ests['____'] - 1.96*average_ests['____']
average_ests['upper'] = average_ests['____'] + 1.96*average_ests['____']
# Setup a grid of plots, with non-shared x axes limits
g = sns.FacetGrid(average_ests, row = '____', ____ = False)
# Plot CI for average estimate
g.map(plt.hlines, 'y', '____', '____')
# Plot observed values for comparison and remove axes labels
g.map(plt.scatter, 'seen', 'y', color = 'orangered').set_ylabels('').set_xlabels('')
plt.show()