Menskalakan sebagian himpunan data
Pada video sebelumnya, Anda telah menggunakan QuantileTransformer pada seluruh himpunan data. Dalam latihan ini, Anda akan berlatih menskalakan hanya sebagian dari sebuah himpunan data. Alasannya adalah karena himpunan data saham memiliki fitur kategorikal yang dikodekan secara numerik (day_of_week, day, month) yang akan terskalakan secara keliru jika Anda menggunakan QuantileTransformer pada seluruh himpunan data.
Transformer telah diimpor dari sklearn bersama dengan himpunan data saham apple yang memiliki fitur tambahan.
Latihan ini merupakan bagian dari kursus
Deteksi Anomali dengan Python
Instruksi latihan
- Buat sebuah daftar yang berisi lima nama kolom numerik dari
apple. - Inisialisasi
QuantileTransformeryang memetakan fitur ke distribusi normal. - Skala dan simpan kelima kolom dalam
to_scalesecara bersamaan.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a list of columns
to_scale = [____]
# Initialize a QuantileTransformer
qt = ____
# Scale and store simultaneously
apple.loc[____] = ____