CommencerCommencer gratuitement

Colorier des catégories ordinales

Vous travaillez pour le conseil municipal de Des Moines afin d’évaluer les relations entre différents niveaux de polluants dans la ville. Les deux polluants les plus importants sont SO2 et NO2, mais le CO présente également un intérêt. On ne vous a accordé de la place que pour un seul graphique dans votre partie du rapport.

Vous commencez par un nuage de points des valeurs de SO2 et NO2, car ce sont les plus importantes, puis vous décidez de représenter les valeurs de CO avec une échelle de couleur correspondant aux quartiles de CO. En regroupant les valeurs continues de CO en classes, vous transformez le CO en variable ordinale, ce qui permet de mettre en évidence des tendances générales sans demander trop d’efforts au lecteur pour comparer des nuances de couleurs très proches.

Cet exercice fait partie du cours

Améliorer vos visualisations de données en Python

Afficher le cours

Instructions

  • Configurez la fonction qcut() pour découper 'CO' en quartiles.
  • Faites correspondre la couleur de votre nuage de points à la nouvelle colonne des quartiles.
  • Modifiez la palette pour utiliser la palette ColorBrewer 'GnBu'.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Divide CO into quartiles
pollution['CO quartile'] = pd.qcut(pollution['CO'], q = ____, labels = False)

# Filter to just Des Moines
des_moines = pollution.query("city  ==  'Des Moines'")

# Color points with by quartile and use ColorBrewer palette
sns.scatterplot(x = 'SO2',
                y = 'NO2',
                ____ = '____', 
                  data = des_moines,
                palette = '____')
plt.show()
Modifier et exécuter le code