CommencerCommencez gratuitement

Identifier un déséquilibre de classes

Vous vous concentrez sur une phase préliminaire essentielle du cycle de vie du Machine Learning : l’exploration des données (EDA).

L’EDA vous permet de mieux comprendre la nature du jeu de données heart_disease_df, y compris les relations entre variables, ainsi que les problèmes potentiels à traiter avant d’entraîner votre modèle. Comprendre la distribution des classes dans vos variables — par exemple, le sexe des patients — est un élément clé de l’EDA.

Un déséquilibre de classes, c’est‑à‑dire lorsqu’une classe contient nettement plus d’exemples qu’une autre, peut biaiser l’entraînement de votre modèle et le pousser à privilégier la classe majoritaire.

Cet exercice fait partie du cours

<cours>Machine Learning de bout en bout</cours>
Voir le cours

Instructions de l’exercice

  • Affichez la répartition des classes de la colonne sex.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Print the sex value counts of the heart disease dataset
print(____[____].____)
Modifier et exécuter le code