CommencerCommencer gratuitement

Visualiser les CP avec un scree plot

Lors d’un entretien en Machine Learning, on peut vous demander quel est le nombre optimal de variables à conserver. Dans cet exercice, vous allez créer un scree plot et une courbe de variance expliquée cumulée des composantes principales en appliquant une ACP (PCA) sur loan_data. Cela vous aidera à déterminer le nombre optimal de composantes principales pour entraîner un modèle de ML plus précis par la suite.

Comme la PCA est une méthode non supervisée, l’analyse en composantes principales est réalisée sur la matrice X après avoir retiré la variable cible Loan Status du jeu de données. Ne pas définir n_components renvoie toutes les composantes principales du modèle entraîné.

Cet exercice fait partie du cours

S’entraîner aux questions d’entretien en Machine Learning avec Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Remove target variable
X = loan_data.____('____', axis=1)

# Instantiate
pca = ____(n_components=____)

# Fit and transform
principalComponents = pca.____(____)
Modifier et exécuter le code