Membersihkan himpunan data Anda
Himpunan data dunia nyata seperti himpunan data penyakit jantung sering kali berantakan, berisi nilai duplikat atau hilang. Dalam latihan ini, Anda akan menerapkan keterampilan yang dipelajari di bab ini untuk melakukan pembersihan data pada himpunan data penyakit jantung. Himpunan data telah dimuat untuk Anda. Tugas Anda adalah mengidentifikasi dan menjalankan operasi pembersihan umum berdasarkan hasil EDA: hapus kolom kosong, buang baris duplikat, dan lakukan imputasi pada kolom restecg, yang berkaitan dengan pengukuran elektrokardiogram. Pandas telah diimpor sebagai pd, dan himpunan data penyakit jantung disimpan sebagai DataFrame pandas bernama heart_disease_df.
Latihan ini adalah bagian dari kursus
Machine Learning Ujung ke Ujung
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)