Resaltar con código fijo
Estás trabajando con la ciudad de Houston para analizar la relación entre la contaminación por dióxido de azufre (SO2) y dióxido de nitrógeno (NO2), en concreto, la contaminación del año más reciente en el que se recogieron datos (2014). Has identificado un día especialmente malo, el 26 de noviembre, cuando hubo un pico elevado en los niveles de SO2. Para dirigir la atención de quienes vean la gráfica a ese mal día, lo vas a resaltar con un tono rojo anaranjado brillante y colorear el resto de puntos en gris.
pandas, matplotlib.pyplot y seaborn están cargados como pd, plt y sns, respectivamente, y estarán disponibles en tu espacio de trabajo durante el resto del curso.
Este curso toca muchos conceptos que quizá hayas olvidado; si necesitas un repaso rápido, descarga la Seaborn Cheat Sheet y tenla a mano.
Este ejercicio forma parte del curso
Mejora tus visualizaciones de datos en Python
Instrucciones del ejercicio
- Modifica la lista por comprensión para colorear el valor correspondiente al día número 330 (
day) (26 de noviembre) delyear2014 enorangeredy el resto de puntos enlightgray. - Pasa el array
houston_colorsaregplot()usando el argumentoscatter_kwspara colorear los puntos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
houston_pollution = pollution[pollution.city == 'Houston']
# Make array orangred for day 330 of year 2014, otherwise lightgray
houston_colors = ['orangered' if (____ == 330) & (____ == 2014) else 'lightgray'
for day,year in zip(houston_pollution.____, houston_pollution.____)]
sns.regplot(x = 'NO2',
y = 'SO2',
data = houston_pollution,
fit_reg = False,
# Send scatterplot argument to color points
scatter_kws = {'facecolors': ____, 'alpha': 0.7})
plt.show()