CommencerCommencer gratuitement

Se débarrasser des couleurs superflues

Vous pourriez vouloir comparer la relation entre CO et NO2 selon les villes à l’aide d’un simple nuage de points, en utilisant la couleur pour différencier les données de chaque ville.

Scatter plot of CO and NO2 with lots of overlapping plots

Malheureusement, le graphique obtenu est très confus. Il est difficile de distinguer les différences entre les villes, car il faut différencier des couleurs proches. Il s’avère que, parfois, la meilleure palette de couleurs pour votre graphique, c’est l’absence de couleur.

Pour remédier à ce graphique difficile à lire, supprimez la composante couleur et créez des facettes par ville. Le résultat sera peut‑être moins esthétique, mais ce sera un bien meilleur outil pour déchiffrer les différences.

Cet exercice fait partie du cours

Améliorer vos visualisations de données en Python

Afficher le cours

Instructions

  • Pour configurer un graphique avec des facettes par city, passez les données pollution à la fonction de tracé, mappez city aux colonnes et définissez une grille de trois colonnes.
  • Utilisez la fonction g.map() pour appliquer un scatterplot() sur la grille avec la même esthétique que le nuage de points d’origine, mais sans l’argument hue.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Hard to read scatter of CO and NO2 w/ color mapped to city
# sns.scatterplot('CO', 'NO2',
#                 alpha = 0.2,
#                 hue = 'city',
#                 data = pollution)

# Setup a facet grid to separate the cities apart
g = sns.FacetGrid(data = ____,
                  col = '____',
                  col_wrap = ____)

# Map sns.scatterplot to create separate city scatter plots
g.map(sns.____, 'CO', 'NO2', alpha = 0.2)
plt.show()
Modifier et exécuter le code