CommencerCommencer gratuitement

Comparer avec deux KDE

Imaginez que vous travaillez pour le fournisseur de filtres à air de référence. Votre entreprise vous demande de rédiger un rapport pour comprendre pourquoi 2012 a été une année particulièrement favorable aux ventes de votre filtre à ozone (O3). Vous avez téléchargé des données utiles sur la pollution auprès de l'USGS et vous souhaitez créer une visualisation concise qui compare la tendance générale de la pollution à l'O3 en 2012 avec toutes les autres années disponibles.

Pour cela, vous pouvez créer deux courbes de densité à noyau (KDE) superposées : une pour les données O3 de 2012 et une autre pour toutes les autres années.

Cet exercice fait partie du cours

Améliorer vos visualisations de données en Python

Afficher le cours

Instructions

  • Filtrez les données dans le premier appel à sns.kdeplot() pour n'inclure que l'année 2012.
  • Ombragez sous la première KDE avec l'argument shade.
  • Ajoutez le label '2012' pour la légende du tracé.
  • Répétez les trois premières étapes pour le second appel à sns.kdeplot(), mais filtrez les données pour exclure 2012. Utilisez le label 'other years'.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Filter dataset to the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3, 
            # Shade under kde and add a helpful label
            shade = ____,
            ____ = '____')

# Filter dataset to everything except the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3, 
            # Again, shade under kde and add a helpful label
            shade = ____,
            ____ = '____')
plt.show()
Modifier et exécuter le code