Erkunde den Datensatz zu Produktkäufen von Kundinnen und Kunden
Du hast den Datensatz „customer by product purchase“ in der Video-Übung erkundet und bist jetzt bereit, ein paar explorative Diagramme zu erstellen, um die Verteilung der Variablen und ihre Beziehungen zu verstehen. Hier erkundest du den Datensatz wholesale und plottest die paarweisen Beziehungen sowie die geschätzten Verteilungen für jede Variable mit der Funktion pairplot aus der Bibliothek seaborn. Es ist ein wichtiger Schritt, die Verteilungstypen und die Beziehungen zwischen den Variablen zu untersuchen, um den Bedarf an weiterem Data-Preprocessing einschätzen zu können.
Die Bibliothek pandas ist als pd geladen, seaborn als sns und matplotlib.pyplot als plt. Außerdem wurde der Datensatz wholesale als pandas-DataFrame geladen.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing mit Python
Anleitung zur Übung
- Gib den Head des
wholesale-Datensatzes aus - Plotte die paarweisen Beziehungen zwischen den Variablen
- Zeige das Diagramm an.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print the header of the `wholesale` dataset
print(___.head())
# Plot the pairwise relationships between the variables
sns.pairplot(___, diag_kind='kde')
# Display the chart
plt.___()