Mengurangi skewness pada variabel
Sekarang Anda akan mentransformasi kolom wholesale menggunakan transformasi Box-Cox, lalu mengeksplorasi plot hubungan berpasangan untuk memastikan kemencengan (skewness) distribusi berkurang sehingga lebih mendekati normal. Ini adalah langkah krusial agar algoritma K-means dapat konvergen dan menemukan kelompok homogen (klaster atau segmen) dari observasi.
Modul stats dimuat dari pustaka scipy, dan himpunan data wholesale telah diimpor sebagai DataFrame pandas.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Definisikan fungsi kustom transformasi Box-Cox yang dapat diterapkan pada DataFrame
pandas. - Terapkan fungsi tersebut pada himpunan data
wholesale. - Plot hubungan berpasangan antar variabel yang telah ditransformasi.
- Tampilkan grafiknya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define custom Box Cox transformation function
def boxcox_df(x):
x_boxcox, _ = stats.___(x)
return x_boxcox
# Apply the function to the `wholesale` dataset
wholesale_boxcox = ___.___(boxcox_df, axis=0)
# Plot the pairwise relationships between the transformed variables
sns.___(___, diag_kind='kde')
# Display the chart
plt.___()