Menemukan ketidakseimbangan kelas
Anda sedang berfokus pada tahap pendahuluan yang penting dalam siklus Machine Learning: Exploratory Data Analysis (EDA).
EDA membantu Anda memahami lebih baik karakteristik himpunan data heart_disease_df, termasuk hubungan antarvariabel, serta potensi masalah yang perlu ditangani sebelum Anda melatih model. Memahami distribusi kelas dalam fitur—misalnya, jenis kelamin pasien—merupakan bagian kunci dari EDA.
Ketidakseimbangan kelas, ketika satu kelas memiliki jumlah sampel jauh lebih banyak daripada kelas lain, berpotensi memengaruhi proses pelatihan model sehingga cenderung mengutamakan kelas mayoritas.
Latihan ini adalah bagian dari kursus
Machine Learning Ujung ke Ujung
Petunjuk latihan
- Cetak keseimbangan kelas dari kolom
sex.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print the sex value counts of the heart disease dataset
print(____[____].____)