Segmentierung mit k-means-Clustering erstellen
In dieser Übung erstellst du eine Kundensegmentierung mit dem KMeans-Algorithmus. Wie du im vorherigen Schritt festgestellt hast, liegt die mathematisch optimale Anzahl von Clustern ungefähr bei 3 oder 4. Hier erstellst du eine Variante mit 4 Segmenten.
Der vorverarbeitete Datensatz wurde als wholesale_scaled_df geladen. Du verwendest ihn, um den KMeans-Algorithmus auszuführen, und den rohen, unverarbeiteten Datensatz wholesale – den nutzt du später, um die durchschnittlichen Spaltenwerte für die 4 Segmente zu untersuchen, die du erstellst.
Diese Übung ist Teil des Kurses
Machine Learning für Marketing mit Python
Anleitung zur Übung
- Importiere den
KMeans-Algorithmus aus dem Modulsklearn.cluster. - Initialisiere
KMeansmit 4 Clustern undrandom_stateauf 123 gesetzt. - Fitte das Modell auf dem vorverarbeiteten Datensatz
wholesale_scaled_df. - Weise die erzeugten Labels als neue Spalte namens
segmentim rohen Datensatzwholesalezu
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import `KMeans` module
from sklearn.cluster import ___
# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)
# Fit the model on the pre-processed dataset
kmeans.fit(___)
# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)