Menemukan ketidakseimbangan kelas
Anda sedang berfokus pada tahap pendahuluan yang penting dalam siklus Machine Learning: Exploratory Data Analysis (EDA).
EDA membantu Anda memahami lebih baik karakteristik himpunan data heart_disease_df, termasuk hubungan antarvariabel, serta potensi masalah yang perlu ditangani sebelum Anda melatih model. Memahami distribusi kelas dalam fitur—misalnya, jenis kelamin pasien—merupakan bagian kunci dari EDA.
Ketidakseimbangan kelas, ketika satu kelas memiliki jumlah sampel jauh lebih banyak daripada kelas lain, berpotensi memengaruhi proses pelatihan model sehingga cenderung mengutamakan kelas mayoritas.
Latihan ini merupakan bagian dari kursus
Machine Learning Ujung ke Ujung
Instruksi latihan
- Cetak keseimbangan kelas dari kolom
sex.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Print the sex value counts of the heart disease dataset
print(____[____].____)