CommencerCommencez gratuitement

Comparer avec deux KDE

Imaginez que vous travaillez pour le fournisseur de filtres à air de référence. Votre entreprise vous demande de rédiger un rapport pour comprendre pourquoi 2012 a été une année particulièrement favorable aux ventes de votre filtre à ozone (O3). Vous avez téléchargé des données utiles sur la pollution auprès de l'USGS et vous souhaitez créer une visualisation concise qui compare la tendance générale de la pollution à l'O3 en 2012 avec toutes les autres années disponibles.

Pour cela, vous pouvez créer deux courbes de densité à noyau (KDE) superposées : une pour les données O3 de 2012 et une autre pour toutes les autres années.

Cet exercice fait partie du cours

<cours>Améliorer vos visualisations de données en Python</cours>
Voir le cours

Instructions de l’exercice

  • Filtrez les données dans le premier appel à sns.kdeplot() pour n'inclure que l'année 2012.
  • Ombragez sous la première KDE avec l'argument shade.
  • Ajoutez le label '2012' pour la légende du tracé.
  • Répétez les trois premières étapes pour le second appel à sns.kdeplot(), mais filtrez les données pour exclure 2012. Utilisez le label 'other years'.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Filter dataset to the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3, 
            # Shade under kde and add a helpful label
            shade = ____,
            ____ = '____')

# Filter dataset to everything except the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3, 
            # Again, shade under kde and add a helpful label
            shade = ____,
            ____ = '____')
plt.show()
Modifier et exécuter le code