LoslegenKostenlos loslegen

Segmentierung mit k-means-Clustering erstellen

In dieser Übung erstellst du eine Kundensegmentierung mit dem KMeans-Algorithmus. Wie du im vorherigen Schritt festgestellt hast, liegt die mathematisch optimale Anzahl von Clustern ungefähr bei 3 oder 4. Hier erstellst du eine Variante mit 4 Segmenten.

Der vorverarbeitete Datensatz wurde als wholesale_scaled_df geladen. Du verwendest ihn, um den KMeans-Algorithmus auszuführen, und den rohen, unverarbeiteten Datensatz wholesale – den nutzt du später, um die durchschnittlichen Spaltenwerte für die 4 Segmente zu untersuchen, die du erstellst.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing mit Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere den KMeans-Algorithmus aus dem Modul sklearn.cluster.
  • Initialisiere KMeans mit 4 Clustern und random_state auf 123 gesetzt.
  • Fitte das Modell auf dem vorverarbeiteten Datensatz wholesale_scaled_df.
  • Weise die erzeugten Labels als neue Spalte namens segment im rohen Datensatz wholesale zu

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)
Code bearbeiten und ausführen