Uso di PCA
In questo esercizio applicherai la PCA al dataset wine per vedere se riesci ad aumentare l'accuratezza del modello.
Questo esercizio fa parte del corso
Preprocessing per il Machine Learning in Python
Istruzioni dell'esercizio
- Istanzia un oggetto
PCA. - Definisci le caratteristiche (
X) e le etichette (y) partendo dawine, usando le etichette nella colonna"Type". - Applica la PCA a
X_traineX_test, evitando data leakage, e salva i valori trasformati comepca_X_trainepca_X_test. - Stampa l'attributo
.explained_variance_ratio_dipcaper verificare quanta varianza è spiegata da ciascun componente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)