Menguji QuantileTransformer
Standarisasi rentan terhadap kendala yang sama seperti z-score. Keduanya menggunakan mean dan standar deviasi dalam perhitungannya, yang membuatnya sangat sensitif terhadap nilai ekstrem.
Untuk mengatasi masalah ini, Anda sebaiknya menggunakan QuantileTransformer yang memanfaatkan kuantil. Kuantil dari suatu sebaran tetap sama terlepas dari besarnya pencilan.
Anda sebaiknya menggunakan StandardScaler saat data berdistribusi normal (yang dapat diperiksa dengan histogram). Untuk distribusi lainnya, QuantileTransformer adalah pilihan yang lebih baik.
Anda akan berlatih pada himpunan data females yang sudah dimuat. matplotlib.pyplot sudah dimuat dengan alias standar, plt.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Instansiasi
QuantileTransformer()yang mengubah fitur menjadi distribusi normal dan tetapkan keqt. - Latih dan transformasikan array fitur
Xserta pertahankan nama kolomnya. - Plot histogram kolom
palmlength.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.preprocessing import QuantileTransformer
# Instantiate an instance that casts to normal
qt = ____
# Fit and transform the feature array
X.____ = ____
# Plot a histogram of palm length
plt.____(____, color='red')
plt.xlabel("Palm length")
plt.show()