Colorear categorías ordinales
Trabajas para el ayuntamiento de Des Moines evaluando las relaciones entre distintos niveles de contaminantes en la ciudad. Los dos más importantes son SO2 y NO2, aunque el CO también interesa. Solo te han permitido espacio para un único gráfico en tu parte del informe.
Empiezas con un diagrama de dispersión de los valores de SO2 y NO2, ya que son los más importantes, y luego decides mostrar los valores de CO usando una escala de color correspondiente a los cuartiles de CO. Al agrupar en intervalos los valores continuos de CO, has convertido CO en una variable ordinal que puede revelar patrones generales sin exigir mucho esfuerzo a quien ve el gráfico para comparar matices de color sutiles.
Este ejercicio forma parte del curso
Mejora tus visualizaciones de datos en Python
Instrucciones del ejercicio
- Configura la función
qcut()para dividir'CO'en cuartiles. - Asigna el color de tu diagrama de dispersión a la nueva columna de cuartiles.
- Cambia la
palettea la paleta de ColorBrewer'GnBu'.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Divide CO into quartiles
pollution['CO quartile'] = pd.qcut(pollution['CO'], q = ____, labels = False)
# Filter to just Des Moines
des_moines = pollution.query("city == 'Des Moines'")
# Color points with by quartile and use ColorBrewer palette
sns.scatterplot(x = 'SO2',
y = 'NO2',
____ = '____',
data = des_moines,
palette = '____')
plt.show()