CommencerCommencer gratuitement

Explorer le jeu de données d’achats produits par client

Vous avez exploré le jeu de données client par achat de produit dans la vidéo et êtes maintenant prêt à tracer quelques graphiques exploratoires pour comprendre la distribution des variables et les relations entre elles. Ici, vous allez explorer le jeu de données wholesale et tracer les relations par paires ainsi que les distributions estimées pour chaque variable avec la fonction pairplot de la bibliothèque seaborn. C’est une étape importante pour analyser les types de distributions et les relations entre variables afin de décider des besoins éventuels en prétraitement des données.

La bibliothèque pandas est importée sous le nom pd, seaborn sous sns, et matplotlib.pyplot sous plt. Le jeu de données wholesale a également été chargé en tant que DataFrame pandas.

Cet exercice fait partie du cours

Machine Learning pour le marketing en Python

Afficher le cours

Instructions

  • Affichez l’entête du jeu de données wholesale
  • Tracez les relations par paires entre les variables
  • Affichez le graphique.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the header of the `wholesale` dataset
print(___.head())

# Plot the pairwise relationships between the variables
sns.pairplot(___, diag_kind='kde')

# Display the chart
plt.___()
Modifier et exécuter le code