Créer un surlignage par programmation
Vous poursuivez votre travail pour la ville de Houston. Vous souhaitez maintenant examiner le comportement de NO2 et SO2 lorsque la valeur d’ozone non tracée (O3) est à son maximum.
Pour cela, remplacez la logique de la compréhension de liste actuelle par une logique qui compare la valeur O3 d’une ligne avec la valeur maximale de O3 observée dans l’ensemble de données. Remarque : utilisez sns.scatterplot() au lieu de sns.regplot(). En effet, sns.scatterplot() peut prendre un vecteur non colorimétrique comme argument hue et colorer automatiquement les points tout en fournissant une légende utile.
Cet exercice fait partie du cours
Améliorer vos visualisations de données en Python
Instructions
- Trouvez la valeur correspondant au
O3le plus élevé observé dans le DataFramehouston_pollution. Veillez à taper la lettreOet non le chiffre zéro ! - Ajoutez la colonne
'point_type'au DataFramehouston_pollutionpour indiquer si la ligne contient la valeur maximale observée de O3. - Passez cette nouvelle colonne à l’argument
huedesns.scatterplot()pour colorer les points.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
houston_pollution = pollution[pollution.city == 'Houston'].copy()
# Find the highest observed O3 value
max_O3 = houston_pollution.O3.____
# Make a column that denotes which day had highest O3
houston_pollution['____'] = ['Highest O3 Day' if ____ == ____ else 'Others' for O3 in houston_pollution.O3]
# Encode the hue of the points with the O3 generated column
sns.scatterplot(x = 'NO2',
y = 'SO2',
hue = '____',
data = houston_pollution)
plt.show()