IniziaInizia gratis

Uso di PCA

In questo esercizio applicherai la PCA al dataset wine per vedere se riesci ad aumentare l'accuratezza del modello.

Questo esercizio fa parte del corso

Preprocessing per il Machine Learning in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Istanzia un oggetto PCA.
  • Definisci le caratteristiche (X) e le etichette (y) partendo da wine, usando le etichette nella colonna "Type".
  • Applica la PCA a X_train e X_test, evitando data leakage, e salva i valori trasformati come pca_X_train e pca_X_test.
  • Stampa l'attributo .explained_variance_ratio_ di pca per verificare quanta varianza è spiegata da ciascun componente.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)
Modifica ed esegui il codice