Bangun segmentasi dengan pengelompokan k-means
Dalam latihan ini, Anda akan membangun segmentasi pelanggan dengan algoritme KMeans. Seperti yang telah Anda identifikasi pada langkah sebelumnya, jumlah klaster yang optimal secara matematis berada di kisaran 3 hingga 4. Di sini, Anda akan membangunnya dengan 4 segmen.
Himpunan data yang telah dipraolah telah dimuat sebagai wholesale_scaled_df. Anda akan menggunakannya untuk menjalankan algoritme KMeans, dan himpunan data mentah yang belum diproses sebagai wholesale — yang nanti akan Anda gunakan untuk menelusuri nilai rata-rata kolom untuk 4 segmen yang Anda bangun.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Impor algoritme
KMeansdari modulsklearn.cluster. - Inisialisasi algoritme
KMeansdengan 4 klaster dan random state disetel ke 123. - Latih model pada himpunan data praolah
wholesale_scaled_df. - Tetapkan label yang dihasilkan ke kolom baru bernama
segmentdi himpunan data mentahwholesale
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import `KMeans` module
from sklearn.cluster import ___
# Initialize `KMeans` with 4 clusters
kmeans=KMeans(___=4, random_state=123)
# Fit the model on the pre-processed dataset
kmeans.fit(___)
# Assign the generated labels to a new column
wholesale_kmeans4 = wholesale.assign(segment = kmeans.___)