Membuat variabel dummy
Kemampuan untuk menyertakan fitur kategorikal dalam proses pembangunan model dapat meningkatkan kinerja karena fitur tersebut dapat menambah informasi yang berkontribusi pada akurasi prediksi.
Himpunan data music_df telah dimuat sebelumnya untuk Anda, dan bentuknya sudah dicetak. Selain itu, pandas telah diimpor sebagai pd.
Sekarang Anda akan membuat DataFrame baru yang berisi kolom-kolom asli dari music_df ditambah variabel dummy dari kolom "genre".
Latihan ini merupakan bagian dari kursus
Supervised Learning dengan scikit-learn
Instruksi latihan
- Gunakan fungsi yang relevan, dengan memberikan seluruh DataFrame
music_df, untuk membuatmusic_dummies, dengan menghapus kolom biner pertama. - Cetak bentuk (
shape) darimusic_dummies.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))