LoslegenKostenlos loslegen

Klassenungleichgewicht erkennen

Du konzentrierst dich auf die wichtige Vorphase im Machine-Learning-Lebenszyklus: Exploratory Data Analysis (EDA).

EDA hilft dir, den heart_disease_df-Datensatz besser zu verstehen – zum Beispiel die Beziehungen zwischen verschiedenen Variablen sowie potenzielle Probleme, die vor dem Training deines Modells behoben werden sollten. Ein zentraler Teil der EDA ist, die Verteilung von Klassen in deinen Merkmalen zu prüfen – etwa das Geschlecht der Patientinnen und Patienten.

Ein Klassenungleichgewicht, bei dem eine Klasse deutlich mehr Stichproben als eine andere hat, kann den Trainingsprozess deines Modells verzerren und dazu führen, dass es die Mehrheitsklasse bevorzugt.

Diese Übung ist Teil des Kurses

End-to-End Machine Learning

Kurs anzeigen

Anleitung zur Übung

  • Gib die Klassenverteilung der Spalte sex aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Print the sex value counts of the heart disease dataset
print(____[____].____)
Code bearbeiten und ausführen