Explorer le jeu de données d’achats produits par client
Vous avez exploré le jeu de données client par achat de produit dans la vidéo et êtes maintenant prêt à tracer quelques graphiques exploratoires pour comprendre la distribution des variables et les relations entre elles. Ici, vous allez explorer le jeu de données wholesale et tracer les relations par paires ainsi que les distributions estimées pour chaque variable avec la fonction pairplot de la bibliothèque seaborn. C’est une étape importante pour analyser les types de distributions et les relations entre variables afin de décider des besoins éventuels en prétraitement des données.
La bibliothèque pandas est importée sous le nom pd, seaborn sous sns, et matplotlib.pyplot sous plt. Le jeu de données wholesale a également été chargé en tant que DataFrame pandas.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Affichez l’entête du jeu de données
wholesale - Tracez les relations par paires entre les variables
- Affichez le graphique.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Print the header of the `wholesale` dataset
print(___.head())
# Plot the pairwise relationships between the variables
sns.pairplot(___, diag_kind='kde')
# Display the chart
plt.___()