Menskalakan sebagian himpunan data
Pada video sebelumnya, Anda telah menggunakan QuantileTransformer pada seluruh himpunan data. Dalam latihan ini, Anda akan berlatih menskalakan hanya sebagian dari sebuah himpunan data. Alasannya adalah karena himpunan data saham memiliki fitur kategorikal yang dikodekan secara numerik (day_of_week, day, month) yang akan terskalakan secara keliru jika Anda menggunakan QuantileTransformer pada seluruh himpunan data.
Transformer telah diimpor dari sklearn bersama dengan himpunan data saham apple yang memiliki fitur tambahan.
Latihan ini adalah bagian dari kursus
Deteksi Anomali dengan Python
Petunjuk latihan
- Buat sebuah daftar yang berisi lima nama kolom numerik dari
apple. - Inisialisasi
QuantileTransformeryang memetakan fitur ke distribusi normal. - Skala dan simpan kelima kolom dalam
to_scalesecara bersamaan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a list of columns
to_scale = [____]
# Initialize a QuantileTransformer
qt = ____
# Scale and store simultaneously
apple.loc[____] = ____