Agrupar datos en intervalos (binning)
Cuando los datos del eje x son valores continuos, puede ser útil dividirlos en diferentes intervalos (bins) para visualizar mejor cómo cambian los datos.
En este ejercicio, veremos la relación entre el coste de la matrícula (Tuition) y la
población de grado, abreviada como UG en estos datos. Empezaremos con un
diagrama de dispersión y examinaremos cómo afectan distintos tamaños de bin a la
visualización.
Este ejercicio forma parte del curso
Visualización de datos intermedia con Seaborn
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a scatter plot by disabling the regression line
sns.regplot(data=df,
y='Tuition',
x='UG',
fit_reg=____)
plt.show()
plt.clf()