Coder en dur une mise en évidence
Vous collaborez avec la ville de Houston pour examiner la relation entre la pollution au dioxyde de soufre (SO2) et au dioxyde d’azote (NO2), en vous concentrant sur l’année la plus récente de collecte des données (2014). Vous avez repéré une journée particulièrement mauvaise, le 26 novembre, marquée par un fort pic des niveaux de SO2. Pour attirer l’attention des lecteurs sur cette journée, vous allez la mettre en évidence avec un rouge orangé vif et colorer le reste des points en gris.
pandas, matplotlib.pyplot et seaborn sont chargés sous les alias pd, plt et sns, respectivement, et seront disponibles dans votre espace de travail pour le reste du cours.
Ce cours couvre de nombreux concepts que vous avez peut-être oubliés. Si vous avez besoin d’un rappel rapide, téléchargez la Seaborn Cheat Sheet et gardez-la à portée de main !
Cet exercice fait partie du cours
Améliorer vos visualisations de données en Python
Instructions
- Modifiez la compréhension de liste pour colorer en
orangeredla valeur correspondant au 330eday(26 novembre) de l’year2014, et enlightgrayle reste des points. - Transmettez le tableau
houston_colorsàregplot()via l’argumentscatter_kwspour colorer les points.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
houston_pollution = pollution[pollution.city == 'Houston']
# Make array orangred for day 330 of year 2014, otherwise lightgray
houston_colors = ['orangered' if (____ == 330) & (____ == 2014) else 'lightgray'
for day,year in zip(houston_pollution.____, houston_pollution.____)]
sns.regplot(x = 'NO2',
y = 'SO2',
data = houston_pollution,
fit_reg = False,
# Send scatterplot argument to color points
scatter_kws = {'facecolors': ____, 'alpha': 0.7})
plt.show()