MulaiMulai sekarang secara gratis

Membersihkan himpunan data Anda

Himpunan data dunia nyata seperti himpunan data penyakit jantung sering kali berantakan, berisi nilai duplikat atau hilang. Dalam latihan ini, Anda akan menerapkan keterampilan yang dipelajari di bab ini untuk melakukan pembersihan data pada himpunan data penyakit jantung. Himpunan data telah dimuat untuk Anda. Tugas Anda adalah mengidentifikasi dan menjalankan operasi pembersihan umum berdasarkan hasil EDA: hapus kolom kosong, buang baris duplikat, dan lakukan imputasi pada kolom restecg, yang berkaitan dengan pengukuran elektrokardiogram. Pandas telah diimpor sebagai pd, dan himpunan data penyakit jantung disimpan sebagai DataFrame pandas bernama heart_disease_df.

Latihan ini adalah bagian dari kursus

Machine Learning Ujung ke Ujung

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Drop empty columns
heart_disease_column_dropped = heart_disease_df.____(____, ____)
Edit dan Jalankan Kode