IniziaInizia gratis

Crea una segmentazione con il clustering k-means

In questo esercizio costruirai la segmentazione dei clienti con l'algoritmo KMeans. Come hai visto nel passaggio precedente, il numero matematicamente ottimale di cluster è intorno a 3 o 4. Qui ne costruirai uno con 4 segmenti.

Il dataset pre-elaborato è stato caricato come wholesale_scaled_df. Lo userai per eseguire l'algoritmo KMeans, mentre il dataset grezzo non elaborato è wholesale — lo userai dopo per esplorare i valori medi delle colonne per i 4 segmenti che costruirai.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Importa l'algoritmo KMeans dal modulo sklearn.cluster.
  • Inizializza l'algoritmo KMeans con 4 cluster e random_state impostato a 123.
  • Allena il modello sul dataset pre-elaborato wholesale_scaled_df.
  • Assegna le etichette generate a una nuova colonna chiamata segment nel dataset grezzo wholesale

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)
Modifica ed esegui il codice