Variabel dummy
Pada latihan terakhir di kursus ini, Anda akan menyiapkan data untuk pemodelan dengan melakukan dummy encoding pada kolom non-numerik.
Sebagai contoh, jika Anda memiliki kolom berisi nilai jenis kelamin, 'Male' dan 'Female', Anda menginginkan kolom terpisah yang memberi tahu apakah suatu observasi berasal dari 'Male' atau 'Female'. Proses membuat variabel dummy ini juga disebut one-hot encoding.
Anda dapat menggunakan fungsi get_dummies() dari pandas untuk mengonversi kolom non-numerik menjadi variabel dummy.
df_new = pd.get_dummies(df)
Kami telah membuat subset DataFrame flights menjadi flights_sub agar lebih mudah melihat apa yang terjadi.
Latihan ini adalah bagian dari kursus
Python untuk Pengguna R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Look at the head of flights_sub
print(____)