Crea una segmentazione con il clustering k-means
In questo esercizio costruirai la segmentazione dei clienti con l'algoritmo KMeans. Come hai visto nel passaggio precedente, il numero matematicamente ottimale di cluster è intorno a 3 o 4. Qui ne costruirai uno con 4 segmenti.
Il dataset pre-elaborato è stato caricato come wholesale_scaled_df. Lo userai per eseguire l'algoritmo KMeans, mentre il dataset grezzo non elaborato è wholesale — lo userai dopo per esplorare i valori medi delle colonne per i 4 segmenti che costruirai.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Importa l'algoritmo
KMeansdal modulosklearn.cluster. - Inizializza l'algoritmo
KMeanscon 4 cluster erandom_stateimpostato a 123. - Allena il modello sul dataset pre-elaborato
wholesale_scaled_df. - Assegna le etichette generate a una nuova colonna chiamata
segmentnel dataset grezzowholesale
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import `KMeans` module
from sklearn.cluster import ___
# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)
# Fit the model on the pre-processed dataset
kmeans.fit(___)
# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)