ComenzarEmpieza gratis

El histograma del bootstrap

Estás pensando en unas vacaciones a Cincinnati en mayo, pero tienes una fuerte sensibilidad al NO2. Extraes varios años de datos de contaminación de Cincinnati en mayo y analizas una estimación bootstrap de los niveles medios de NO2. Solo tienes una estimación, así que la mejor forma de visualizar los resultados de tus estimaciones bootstrap es con un histograma.

Aunque a ti te convence la intuición que da el histograma del bootstrap por sí solo, a tu pareja, que irá contigo de vacaciones, le gusta ver intervalos porcentuales. Para adaptarte, decides resaltar el intervalo del 95 % sombreando la región.

Este ejercicio forma parte del curso

Mejora tus visualizaciones de datos en Python

Ver curso

Instrucciones del ejercicio

  • Indica a la función percentile() los percentiles inferior y superior necesarios para obtener un intervalo del 95 %.
  • Sombrea el fondo de la gráfica en el intervalo del 95 %.
  • Dibuja el histograma de las medias bootstrap con 100 bins.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

cinci_may_NO2 = pollution.query("city  ==  'Cincinnati' & month  ==  5").NO2

# Generate bootstrap samples
boot_means = bootstrap(cinci_may_NO2, 1000)

# Get lower and upper 95% interval bounds
lower, upper = np.percentile(boot_means, [____, ____])

# Plot shaded area for interval
plt.axvspan(____, ____, color = 'gray', alpha = 0.2)

# Draw histogram of bootstrap samples
sns.histplot(____, ____ = 100)

plt.show()
Editar y ejecutar código