Bangun segmentasi dengan pengelompokan k-means

Dalam latihan ini, Anda akan membangun segmentasi pelanggan dengan algoritme KMeans. Seperti yang telah Anda identifikasi pada langkah sebelumnya, jumlah klaster yang optimal secara matematis berada di kisaran 3 hingga 4. Di sini, Anda akan membangunnya dengan 4 segmen.

Himpunan data yang telah dipraolah telah dimuat sebagai wholesale_scaled_df. Anda akan menggunakannya untuk menjalankan algoritme KMeans, dan himpunan data mentah yang belum diproses sebagai wholesale — yang nanti akan Anda gunakan untuk menelusuri nilai rata-rata kolom untuk 4 segmen yang Anda bangun.

Latihan ini merupakan bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Instruksi latihan

Impor algoritme KMeans dari modul sklearn.cluster.
Inisialisasi algoritme KMeans dengan 4 klaster dan random state disetel ke 123.
Latih model pada himpunan data praolah wholesale_scaled_df.
Tetapkan label yang dihasilkan ke kolom baru bernama segment di himpunan data mentah wholesale

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import `KMeans` module
from sklearn.cluster import ___

# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)

# Fit the model on the pre-processed dataset
kmeans.fit(___)

# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)

Edit dan Jalankan Kode