ComenzarEmpieza gratis

Regresiones con bootstrap

Mientras trabajas para el departamento de parques y recreación de Long Beach investigando la relación entre NO2 y SO2, notaste un grupo de posibles valores atípicos que sospechas que podrían estar sesgando las correlaciones.

SO2 NO2 scatter

Investiga la incertidumbre de tus correlaciones mediante remuestreo bootstrap para ver cuán estables son tus ajustes. Por comodidad, el muestreo bootstrap ya está hecho y se proporciona como no2_so2_boot junto con no2_so2 para los datos sin remuestreo.

Este ejercicio forma parte del curso

Mejora tus visualizaciones de datos en Python

Ver curso

Instrucciones del ejercicio

  • Indica a sns.lmplot() que debe dibujar una línea de regresión independiente para cada sample del bootstrap.
  • Colorea cada línea de regresión de 'steelblue' y hazlas con una opacidad del 20%.
  • Desactiva las bandas de confianza predeterminadas de Seaborn alrededor de las líneas de regresión.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

sns.lmplot('NO2', 'SO2', data = no2_so2_boot,
           # Tell seaborn to a regression line for each sample
           ____ = 'sample', 
           # Make lines blue and transparent
           line_kws = {'____': 'steelblue', '____': 0.2},
           # Disable built-in confidence intervals
           ci = ____, legend = False, scatter = False)

# Draw scatter of all points
plt.scatter('NO2', 'SO2', data = no2_so2)

plt.show()
Editar y ejecutar código