CommencerCommencer gratuitement

Créer un surlignage par programmation

Vous poursuivez votre travail pour la ville de Houston. Vous souhaitez maintenant examiner le comportement de NO2 et SO2 lorsque la valeur d’ozone non tracée (O3) est à son maximum.

Pour cela, remplacez la logique de la compréhension de liste actuelle par une logique qui compare la valeur O3 d’une ligne avec la valeur maximale de O3 observée dans l’ensemble de données. Remarque : utilisez sns.scatterplot() au lieu de sns.regplot(). En effet, sns.scatterplot() peut prendre un vecteur non colorimétrique comme argument hue et colorer automatiquement les points tout en fournissant une légende utile.

Cet exercice fait partie du cours

Améliorer vos visualisations de données en Python

Afficher le cours

Instructions

  • Trouvez la valeur correspondant au O3 le plus élevé observé dans le DataFrame houston_pollution. Veillez à taper la lettre O et non le chiffre zéro !
  • Ajoutez la colonne 'point_type' au DataFrame houston_pollution pour indiquer si la ligne contient la valeur maximale observée de O3.
  • Passez cette nouvelle colonne à l’argument hue de sns.scatterplot() pour colorer les points.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

houston_pollution = pollution[pollution.city  ==  'Houston'].copy()

# Find the highest observed O3 value
max_O3 = houston_pollution.O3.____

# Make a column that denotes which day had highest O3
houston_pollution['____'] = ['Highest O3 Day' if ____  ==  ____ else 'Others' for O3 in houston_pollution.O3]

# Encode the hue of the points with the O3 generated column
sns.scatterplot(x = 'NO2',
                y = 'SO2',
                hue = '____',
                data = houston_pollution)
plt.show()
Modifier et exécuter le code