CommencerCommencer gratuitement

Améliorer vos KDE

Une façon d’enrichir les KDE consiste à ajouter un rug plot. Les rug plots sont de petits tirets tracés sous la courbe de densité qui indiquent précisément où se trouve chaque point de données. L’ajout d’un rug plot est particulièrement utile lorsque vous n’avez pas beaucoup de données.

Avec de faibles volumes de données, il y a souvent des zones sans aucune observation le long de votre support, et il peut être difficile de savoir si une ligne de KDE non nulle signifie qu’il y avait des données ou si cela vient d’un noyau trop large. Un rug plot aide à lever cette ambiguïté.

Revenons à la fonction sns.kdeplot() pour tracer deux KDE : l’un pour les données de Vandenberg Air Force Base et l’autre pour toutes les autres villes du jeu de données sur la pollution. Comme beaucoup moins de données contribuent à la forme du tracé de Vandenberg, ajoutez un rug plot en dessous.

Cet exercice fait partie du cours

Améliorer vos visualisations de données en Python

Afficher le cours

Instructions

  • Colorez le tracé de Vandenberg en 'steelblue'.
  • Activez la fonctionnalité de rug plot pour le tracé de Vandenberg.
  • Définissez la couleur du tracé non Vandenberg sur 'gray'.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

sns.kdeplot(pollution[pollution.city == 'Vandenberg Air Force Base'].O3, 
             label = 'Vandenberg',
             # Turn the color blue to stand out
             color = '____')

# Turn on rugplot
sns.____(pollution[pollution.city == 'Vandenberg Air Force Base'].O3, 
             label = 'Vandenberg',
             color = 'steelblue')

sns.kdeplot(pollution[pollution.city != 'Vandenberg Air Force Base'].O3,
             label = 'Other cities',
             # Turn the color gray
             color = '____')
plt.show()
Modifier et exécuter le code