Crea una segmentazione con il clustering k-means

In questo esercizio costruirai la segmentazione dei clienti con l'algoritmo KMeans. Come hai visto nel passaggio precedente, il numero matematicamente ottimale di cluster è intorno a 3 o 4. Qui ne costruirai uno con 4 segmenti.

Il dataset pre-elaborato è stato caricato come wholesale_scaled_df. Lo userai per eseguire l'algoritmo KMeans, mentre il dataset grezzo non elaborato è wholesale — lo userai dopo per esplorare i valori medi delle colonne per i 4 segmenti che costruirai.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza corso

Istruzioni dell'esercizio

Importa l'algoritmo KMeans dal modulo sklearn.cluster.
Inizializza l'algoritmo KMeans con 4 cluster e random_state impostato a 123.
Allena il modello sul dataset pre-elaborato wholesale_scaled_df.
Assegna le etichette generate a una nuova colonna chiamata segment nel dataset grezzo wholesale

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)

Modifica ed esegui il codice