El histograma del bootstrap
Estás pensando en unas vacaciones a Cincinnati en mayo, pero tienes una fuerte sensibilidad al NO2. Extraes varios años de datos de contaminación de Cincinnati en mayo y analizas una estimación bootstrap de los niveles medios de NO2. Solo tienes una estimación, así que la mejor forma de visualizar los resultados de tus estimaciones bootstrap es con un histograma.
Aunque a ti te convence la intuición que da el histograma del bootstrap por sí solo, a tu pareja, que irá contigo de vacaciones, le gusta ver intervalos porcentuales. Para adaptarte, decides resaltar el intervalo del 95 % sombreando la región.
Este ejercicio forma parte del curso
Mejora tus visualizaciones de datos en Python
Instrucciones del ejercicio
- Indica a la función
percentile()los percentiles inferior y superior necesarios para obtener un intervalo del 95 %. - Sombrea el fondo de la gráfica en el intervalo del 95 %.
- Dibuja el histograma de las medias bootstrap con 100 bins.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
cinci_may_NO2 = pollution.query("city == 'Cincinnati' & month == 5").NO2
# Generate bootstrap samples
boot_means = bootstrap(cinci_may_NO2, 1000)
# Get lower and upper 95% interval bounds
lower, upper = np.percentile(boot_means, [____, ____])
# Plot shaded area for interval
plt.axvspan(____, ____, color = 'gray', alpha = 0.2)
# Draw histogram of bootstrap samples
sns.histplot(____, ____ = 100)
plt.show()