Membuat variabel dummy
Kemampuan untuk menyertakan fitur kategorikal dalam proses pembangunan model dapat meningkatkan kinerja karena fitur tersebut dapat menambah informasi yang berkontribusi pada akurasi prediksi.
Himpunan data music_df telah dimuat sebelumnya untuk Anda, dan bentuknya sudah dicetak. Selain itu, pandas telah diimpor sebagai pd.
Sekarang Anda akan membuat DataFrame baru yang berisi kolom-kolom asli dari music_df ditambah variabel dummy dari kolom "genre".
Latihan ini adalah bagian dari kursus
Supervised Learning dengan scikit-learn
Petunjuk latihan
- Gunakan fungsi yang relevan, dengan memberikan seluruh DataFrame
music_df, untuk membuatmusic_dummies, dengan menghapus kolom biner pertama. - Cetak bentuk (
shape) darimusic_dummies.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create music_dummies
music_dummies = ____
# Print the new DataFrame's shape
print("Shape of music_dummies: {}".format(____))