Utiliser la PCA

Dans cet exercice, vous allez appliquer la PCA au jeu de données wine pour voir si vous pouvez améliorer la précision du modèle.

Cet exercice fait partie du cours

<cours>Prétraitement pour le Machine Learning en Python</cours>

Voir le cours

Instructions de l’exercice

Instanciez un objet PCA.
Définissez les variables explicatives (X) et la cible (y) à partir de wine, en utilisant les étiquettes de la colonne "Type".
Appliquez la PCA à X_train et X_test en évitant toute fuite de données, puis stockez les valeurs transformées dans pca_X_train et pca_X_test.
Affichez l’attribut .explained_variance_ratio_ de pca pour vérifier la part de variance expliquée par chaque composante.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)

Modifier et exécuter le code