Segmentierung mit k-means-Clustering erstellen

In dieser Übung erstellst du eine Kundensegmentierung mit dem KMeans-Algorithmus. Wie du im vorherigen Schritt festgestellt hast, liegt die mathematisch optimale Anzahl von Clustern ungefähr bei 3 oder 4. Hier erstellst du eine Variante mit 4 Segmenten.

Der vorverarbeitete Datensatz wurde als wholesale_scaled_df geladen. Du verwendest ihn, um den KMeans-Algorithmus auszuführen, und den rohen, unverarbeiteten Datensatz wholesale – den nutzt du später, um die durchschnittlichen Spaltenwerte für die 4 Segmente zu untersuchen, die du erstellst.

Diese Übung ist Teil des Kurses

<Kurs>Machine Learning für Marketing mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Importiere den KMeans-Algorithmus aus dem Modul sklearn.cluster.
Initialisiere KMeans mit 4 Clustern und random_state auf 123 gesetzt.
Fitte das Modell auf dem vorverarbeiteten Datensatz wholesale_scaled_df.
Weise die erzeugten Labels als neue Spalte namens segment im rohen Datensatz wholesale zu

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)

Code bearbeiten und ausführen