Visualiser la séparation des classes avec l’ACP I
Une question fréquente lors d’un entretien en Machine Learning consiste à visualiser la réduction de dimension après une ACP. Dans cet exercice, vous allez justement tracer les deux premières composantes principales de loan_data afin de visualiser la séparation des classes entre ces composantes selon que le prêt a été totalement remboursé ou passé en perte.
Le jeu de données loan_data a été normalisé et encodé en one-hot, ce qui signifie que les variables catégorielles ont été transformées en indicateurs binaires, car les variables doivent être sur la même échelle et numériques avant de réaliser une ACP.
Un modèle d’ACP avec 2 CP ainsi que la configuration d’un graphique avec les étiquettes des axes x et y et un titre ont déjà été préparés pour vous. Vous utiliserez un DataFrame appelé loan_data_PCA dans les exercices. Les valeurs possibles de la variable cible Loan Status sont 0 et 1. Vous tracerez PC1 sur l’axe des abscisses et PC2 sur l’axe des ordonnées.
Les imports suivants sont déjà disponibles : matplotlib.pyplot sous le nom plt, seaborn sous le nom sns, et PCA depuis sklearn.decomposition.
Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en Machine Learning avec Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
targets = [____, ____]
colors = ['r', 'b']
# For loop to create plot
for target, color in zip(____, ____):
indicesToKeep = ____['____'] == ____