MulaiMulai sekarang secara gratis

Membinarisasi kolom

Meskipun nilai numerik sering dapat digunakan tanpa rekayasa fitur, ada kalanya beberapa bentuk manipulasi akan berguna. Misalnya, dalam beberapa kasus, Anda mungkin tidak peduli dengan besaran nilai, melainkan arahnya, atau apakah nilai itu ada sama sekali. Dalam situasi seperti ini, Anda perlu membinarisasi sebuah kolom. Pada data so_survey_df, ada banyak responden survei yang bekerja secara sukarela (tanpa bayaran). Anda akan membuat kolom baru bernama Paid_Job yang menunjukkan apakah setiap orang dibayar (gaji mereka lebih besar dari nol).

Latihan ini adalah bagian dari kursus

Rekayasa Fitur untuk Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Buat kolom baru bernama Paid_Job yang diisi dengan nol.
  • Ganti semua nilai Paid_Job dengan 1 jika ConvertedSalary yang bersesuaian lebih besar dari 0.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the Paid_Job column filled with zeros
so_survey_df[____] = ____

# Replace all the Paid_Job values where ConvertedSalary is > 0
so_survey_df.____[____, 'Paid_Job'] = 1

# Print the first five rows of the columns
print(so_survey_df[['Paid_Job', 'ConvertedSalary']].head())
Edit dan Jalankan Kode