Mengurangi skewness pada variabel
Sekarang Anda akan mentransformasi kolom wholesale menggunakan transformasi Box-Cox, lalu mengeksplorasi plot hubungan berpasangan untuk memastikan kemencengan (skewness) distribusi berkurang sehingga lebih mendekati normal. Ini adalah langkah krusial agar algoritma K-means dapat konvergen dan menemukan kelompok homogen (klaster atau segmen) dari observasi.
Modul stats dimuat dari pustaka scipy, dan himpunan data wholesale telah diimpor sebagai DataFrame pandas.
Latihan ini merupakan bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Instruksi latihan
- Definisikan fungsi kustom transformasi Box-Cox yang dapat diterapkan pada DataFrame
pandas. - Terapkan fungsi tersebut pada himpunan data
wholesale. - Plot hubungan berpasangan antar variabel yang telah ditransformasi.
- Tampilkan grafiknya.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Define custom Box Cox transformation function
def boxcox_df(x):
x_boxcox, _ = stats.___(x)
return x_boxcox
# Apply the function to the `wholesale` dataset
wholesale_boxcox = ___.___(boxcox_df, axis=0)
# Plot the pairwise relationships between the transformed variables
sns.___(___, diag_kind='kde')
# Display the chart
plt.___()