Mesures pour classes déséquilibrées
Le déséquilibre des classes peut nuire aux performances de votre modèle dans tout contexte de Machine Learning. C’est particulièrement pertinent en entretien de Machine Learning si l’on vous demande quoi faire avec un jeu de données présentant des classes déséquilibrées, car certains jeux sont déséquilibrés par nature, comme les données de fraude à l’assurance.
Dans cet exercice, vous allez utiliser sklearn pour créer un modèle de régression logistique et afficher la matrice de confusion ainsi que plusieurs mesures d’évaluation, afin de mieux comprendre comment interpréter des modèles de Machine Learning entraînés sur des jeux de données aux classes déséquilibrées.
Rappelez-vous le déséquilibre de classes observé précédemment dans loan_data. Le nombre d’observations avec un statut de prêt Fully Paid est bien supérieur à celui des prêts Charged Off :

Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en Machine Learning avec Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import
from sklearn.____ import ____
from sklearn.____ import ____, ____, ____, ____, _____