Améliorer vos KDE
Une façon d’enrichir les KDE consiste à ajouter un rug plot. Les rug plots sont de petits tirets tracés sous la courbe de densité qui indiquent précisément où se trouve chaque point de données. L’ajout d’un rug plot est particulièrement utile lorsque vous n’avez pas beaucoup de données.
Avec de faibles volumes de données, il y a souvent des zones sans aucune observation le long de votre support, et il peut être difficile de savoir si une ligne de KDE non nulle signifie qu’il y avait des données ou si cela vient d’un noyau trop large. Un rug plot aide à lever cette ambiguïté.
Revenons à la fonction sns.kdeplot() pour tracer deux KDE : l’un pour les données de Vandenberg Air Force Base et l’autre pour toutes les autres villes du jeu de données sur la pollution. Comme beaucoup moins de données contribuent à la forme du tracé de Vandenberg, ajoutez un rug plot en dessous.
Cet exercice fait partie du cours
Améliorer vos visualisations de données en Python
Instructions
- Colorez le tracé de Vandenberg en
'steelblue'. - Activez la fonctionnalité de rug plot pour le tracé de Vandenberg.
- Définissez la couleur du tracé non Vandenberg sur
'gray'.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
sns.kdeplot(pollution[pollution.city == 'Vandenberg Air Force Base'].O3,
label = 'Vandenberg',
# Turn the color blue to stand out
color = '____')
# Turn on rugplot
sns.____(pollution[pollution.city == 'Vandenberg Air Force Base'].O3,
label = 'Vandenberg',
color = 'steelblue')
sns.kdeplot(pollution[pollution.city != 'Vandenberg Air Force Base'].O3,
label = 'Other cities',
# Turn the color gray
color = '____')
plt.show()