Encoding fitur biner
Mengubah tipe data merupakan bagian penting dari prapemrosesan data. Dalam latihan ini, Anda akan menetapkan nilai 1 untuk 'yes' dan 0 untuk 'no' pada fitur 'Vmail_Plan' dan 'Churn'.
Anda telah melihat dua pendekatan untuk melakukan hal ini di video—satu menggunakan pandas, dan satu lagi menggunakan scikit-learn. Untuk tugas-tugas sederhana seperti ini, disarankan tetap menggunakan pandas, jadi itulah yang akan kita lakukan pada latihan ini. Di sisi lain, jika Anda ingin membangun pipeline Machine Learning—yang berada di luar cakupan kursus ini—Anda dapat mengeksplorasi penggunaan LabelEncoder(). Saat melakukan data science, penting untuk disadari bahwa selalu ada lebih dari satu cara untuk menyelesaikan sebuah tugas, dan Anda perlu memilih cara yang paling efektif untuk aplikasi Anda.
Latihan ini adalah bagian dari kursus
Analitik Pemasaran: Memprediksi Churn Pelanggan di Python
Petunjuk latihan
- Ganti
'no'dengan0dan'yes'dengan1pada kolom'Vmail_Plan'ditelco. - Lakukan hal yang sama untuk kolom
'Churn'.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Replace 'no' with 0 and 'yes' with 1 in 'Vmail_Plan'
telco['Vmail_Plan'] = telco['____'].____(____)
# Replace 'no' with 0 and 'yes' with 1 in 'Churn'
telco['Churn'] = ____
# Print the results to verify
print(telco['Vmail_Plan'].head())
print(telco['Churn'].head())