Değişkenlerin çarpıklığını gider
Şimdi wholesale sütunlarını Box-Cox dönüşümüyle dönüştürecek ve ardından dağılımların çarpıklığının azalıp daha normale yaklaştığından emin olmak için ikili ilişkiler grafiğini inceleyeceksin. Bu, K-means algoritmasının yakınsamasını ve gözlemlerin homojen gruplarını (diğer adıyla kümeler veya segmentler) keşfetmesini sağlamak için kritik bir adımdır.
stats modülü scipy kütüphanesinden yüklendi ve wholesale veri kümesi pandas DataFrame olarak içe aktarıldı.
Bu egzersiz
Python ile Pazarlama için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Bir
pandasDataFrame'ine uygulanabilecek özel bir Box-Cox dönüşüm fonksiyonu tanımla. - Fonksiyonu
wholesaleveri kümesine uygula. - Dönüştürülmüş değişkenler arasındaki ikili ilişkileri görselleştir.
- Grafiği görüntüle.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Define custom Box Cox transformation function
def boxcox_df(x):
x_boxcox, _ = stats.___(x)
return x_boxcox
# Apply the function to the `wholesale` dataset
wholesale_boxcox = ___.___(boxcox_df, axis=0)
# Plot the pairwise relationships between the transformed variables
sns.___(___, diag_kind='kde')
# Display the chart
plt.___()