Utiliser la PCA
Dans cet exercice, vous allez appliquer la PCA au jeu de données wine pour voir si vous pouvez améliorer la précision du modèle.
Cet exercice fait partie du cours
Prétraitement pour le Machine Learning en Python
Instructions
- Instanciez un objet
PCA. - Définissez les variables explicatives (
X) et la cible (y) à partir dewine, en utilisant les étiquettes de la colonne"Type". - Appliquez la PCA à
X_trainetX_testen évitant toute fuite de données, puis stockez les valeurs transformées danspca_X_trainetpca_X_test. - Affichez l’attribut
.explained_variance_ratio_depcapour vérifier la part de variance expliquée par chaque composante.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)