Comparer avec deux KDE
Imaginez que vous travaillez pour le fournisseur de filtres à air de référence. Votre entreprise vous demande de rédiger un rapport pour comprendre pourquoi 2012 a été une année particulièrement favorable aux ventes de votre filtre à ozone (O3). Vous avez téléchargé des données utiles sur la pollution auprès de l'USGS et vous souhaitez créer une visualisation concise qui compare la tendance générale de la pollution à l'O3 en 2012 avec toutes les autres années disponibles.
Pour cela, vous pouvez créer deux courbes de densité à noyau (KDE) superposées : une pour les données O3 de 2012 et une autre pour toutes les autres années.
Cet exercice fait partie du cours
Améliorer vos visualisations de données en Python
Instructions
- Filtrez les données dans le premier appel à
sns.kdeplot()pour n'inclure que l'année2012. - Ombragez sous la première KDE avec l'argument
shade. - Ajoutez le label
'2012'pour la légende du tracé. - Répétez les trois premières étapes pour le second appel à
sns.kdeplot(), mais filtrez les données pour exclure2012. Utilisez le label'other years'.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Filter dataset to the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Shade under kde and add a helpful label
shade = ____,
____ = '____')
# Filter dataset to everything except the year 2012
sns.kdeplot(pollution[pollution.year ____ ____].O3,
# Again, shade under kde and add a helpful label
shade = ____,
____ = '____')
plt.show()