Mulai sekarangMulai gratis

Mengurangi skewness pada variabel

Sekarang Anda akan mentransformasi kolom wholesale menggunakan transformasi Box-Cox, lalu mengeksplorasi plot hubungan berpasangan untuk memastikan kemencengan (skewness) distribusi berkurang sehingga lebih mendekati normal. Ini adalah langkah krusial agar algoritma K-means dapat konvergen dan menemukan kelompok homogen (klaster atau segmen) dari observasi.

Modul stats dimuat dari pustaka scipy, dan himpunan data wholesale telah diimpor sebagai DataFrame pandas.

Latihan ini merupakan bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Instruksi latihan

  • Definisikan fungsi kustom transformasi Box-Cox yang dapat diterapkan pada DataFrame pandas.
  • Terapkan fungsi tersebut pada himpunan data wholesale.
  • Plot hubungan berpasangan antar variabel yang telah ditransformasi.
  • Tampilkan grafiknya.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Define custom Box Cox transformation function
def boxcox_df(x):
    x_boxcox, _ = stats.___(x)
    return x_boxcox

# Apply the function to the `wholesale` dataset
wholesale_boxcox = ___.___(boxcox_df, axis=0)

# Plot the pairwise relationships between the transformed variables 
sns.___(___, diag_kind='kde')

# Display the chart
plt.___()
Edit dan Jalankan Kode