MulaiMulai sekarang secara gratis

Mengurangi skewness pada variabel

Sekarang Anda akan mentransformasi kolom wholesale menggunakan transformasi Box-Cox, lalu mengeksplorasi plot hubungan berpasangan untuk memastikan kemencengan (skewness) distribusi berkurang sehingga lebih mendekati normal. Ini adalah langkah krusial agar algoritma K-means dapat konvergen dan menemukan kelompok homogen (klaster atau segmen) dari observasi.

Modul stats dimuat dari pustaka scipy, dan himpunan data wholesale telah diimpor sebagai DataFrame pandas.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Petunjuk latihan

  • Definisikan fungsi kustom transformasi Box-Cox yang dapat diterapkan pada DataFrame pandas.
  • Terapkan fungsi tersebut pada himpunan data wholesale.
  • Plot hubungan berpasangan antar variabel yang telah ditransformasi.
  • Tampilkan grafiknya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define custom Box Cox transformation function
def boxcox_df(x):
    x_boxcox, _ = stats.___(x)
    return x_boxcox

# Apply the function to the `wholesale` dataset
wholesale_boxcox = ___.___(boxcox_df, axis=0)

# Plot the pairwise relationships between the transformed variables 
sns.___(___, diag_kind='kde')

# Display the chart
plt.___()
Edit dan Jalankan Kode