CommencerCommencer gratuitement

Approfondir avec des transformations de base

Vous souhaitez vérifier si la population d’un État est corrélée au nombre d’articles vendus sur les marchés fermiers. Pour cela, appliquez le logarithme à la population et tracez un nuage de points par rapport au nombre d’articles vendus par marché. D’après vos explorations précédentes du jeu de données, vous savez qu’il y aura beaucoup de superpositions ; pour mieux distinguer les tendances, vous souhaitez réduire l’opacité des marqueurs.

Cet exercice fait partie du cours

Améliorer vos visualisations de données en Python

Afficher le cours

Instructions

  • Utilisez numpy (importé sous le nom np) pour créer une nouvelle colonne : log_pop en appliquant le logarithme à la population de l’État.
  • Passez cette nouvelle colonne logarithmique au paramètre x de la fonction de tracé en nuage de points.
  • Réglez l’opacité du nuage de points à 25 % pour visualiser les superpositions.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a new logged population column 
markets['____'] = np.____(markets['____'])

# Draw a scatterplot of log-population to # of items sold
sns.scatterplot(x = '____', 
                  y = 'num_items_sold', 
                  # Reduce point opacity to show overlap
                  ____ = ____, 
                  data = markets)

plt.show()
Modifier et exécuter le code