Membinarisasi kolom
Meskipun nilai numerik sering dapat digunakan tanpa rekayasa fitur, ada kalanya beberapa bentuk manipulasi akan berguna. Misalnya, dalam beberapa kasus, Anda mungkin tidak peduli dengan besaran nilai, melainkan arahnya, atau apakah nilai itu ada sama sekali. Dalam situasi seperti ini, Anda perlu membinarisasi sebuah kolom. Pada data so_survey_df, ada banyak responden survei yang bekerja secara sukarela (tanpa bayaran). Anda akan membuat kolom baru bernama Paid_Job yang menunjukkan apakah setiap orang dibayar (gaji mereka lebih besar dari nol).
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk Machine Learning di Python
Petunjuk latihan
- Buat kolom baru bernama
Paid_Jobyang diisi dengan nol. - Ganti semua nilai
Paid_Jobdengan 1 jikaConvertedSalaryyang bersesuaian lebih besar dari 0.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____
# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1
# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())