Klassenungleichgewicht erkennen
Du konzentrierst dich auf die wichtige Vorphase im Machine-Learning-Lebenszyklus: Exploratory Data Analysis (EDA).
EDA hilft dir, den heart_disease_df-Datensatz besser zu verstehen – zum Beispiel die Beziehungen zwischen verschiedenen Variablen sowie potenzielle Probleme, die vor dem Training deines Modells behoben werden sollten. Ein zentraler Teil der EDA ist, die Verteilung von Klassen in deinen Merkmalen zu prüfen – etwa das Geschlecht der Patientinnen und Patienten.
Ein Klassenungleichgewicht, bei dem eine Klasse deutlich mehr Stichproben als eine andere hat, kann den Trainingsprozess deines Modells verzerren und dazu führen, dass es die Mehrheitsklasse bevorzugt.
Diese Übung ist Teil des Kurses
End-to-End Machine Learning
Anleitung zur Übung
- Gib die Klassenverteilung der Spalte
sexaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print the sex value counts of the heart disease dataset
print(____[____].____)