Uso di PCA

In questo esercizio applicherai la PCA al dataset wine per vedere se riesci ad aumentare l'accuratezza del modello.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Istruzioni dell'esercizio

Istanzia un oggetto PCA.
Definisci le caratteristiche (X) e le etichette (y) partendo da wine, usando le etichette nella colonna "Type".
Applica la PCA a X_train e X_test, evitando data leakage, e salva i valori trasformati come pca_X_train e pca_X_test.
Stampa l'attributo .explained_variance_ratio_ di pca per verificare quanta varianza è spiegata da ciascun componente.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)

Modifica ed esegui il codice