CommencerCommencer gratuitement

Coder en dur une mise en évidence

Vous collaborez avec la ville de Houston pour examiner la relation entre la pollution au dioxyde de soufre (SO2) et au dioxyde d’azote (NO2), en vous concentrant sur l’année la plus récente de collecte des données (2014). Vous avez repéré une journée particulièrement mauvaise, le 26 novembre, marquée par un fort pic des niveaux de SO2. Pour attirer l’attention des lecteurs sur cette journée, vous allez la mettre en évidence avec un rouge orangé vif et colorer le reste des points en gris.

pandas, matplotlib.pyplot et seaborn sont chargés sous les alias pd, plt et sns, respectivement, et seront disponibles dans votre espace de travail pour le reste du cours.

Ce cours couvre de nombreux concepts que vous avez peut-être oubliés. Si vous avez besoin d’un rappel rapide, téléchargez la Seaborn Cheat Sheet et gardez-la à portée de main !

Cet exercice fait partie du cours

Améliorer vos visualisations de données en Python

Afficher le cours

Instructions

  • Modifiez la compréhension de liste pour colorer en orangered la valeur correspondant au 330e day (26 novembre) de l’year 2014, et en lightgray le reste des points.
  • Transmettez le tableau houston_colors à regplot() via l’argument scatter_kws pour colorer les points.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

houston_pollution = pollution[pollution.city  ==  'Houston']

# Make array orangred for day 330 of year 2014, otherwise lightgray
houston_colors = ['orangered' if (____  ==  330) & (____  ==  2014) else 'lightgray' 
                  for day,year in zip(houston_pollution.____, houston_pollution.____)]

sns.regplot(x = 'NO2',
            y = 'SO2',
            data = houston_pollution,
            fit_reg = False, 
            # Send scatterplot argument to color points 
            scatter_kws = {'facecolors': ____, 'alpha': 0.7})
plt.show()
Modifier et exécuter le code