Techniques contre la multicolinéarité - ACP
Dans le dernier exercice, vous avez utilisé de l’ingénierie des caractéristiques pour combiner les variables indépendantes s1 et s2 en s1_s2, car elles affichaient la corrélation la plus élevée dans le jeu de données diabetes.
Dans cet exercice, vous allez appliquer une ACP sur diabetes pour supprimer la multicolinéarité avant d’y ajuster une régression linéaire. Ensuite, vous comparerez les métriques obtenues à celles du dernier exercice. Enfin, vous visualiserez la matrice de corrélation et sa carte thermique du jeu de données, puisque l’ACP supprime totalement la multicolinéarité.
Cet exercice fait partie du cours
S’entraîner aux questions d’entretien en Machine Learning avec Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import
from sklearn.decomposition import ____
# Instantiate
pca = ____()
# Fit on train
pca.____(____)
# Transform train and test
X_trainPCA = pca.____(____)
X_testPCA = pca.____(____)