Aan de slagGa gratis aan de slag

PCA gebruiken

In deze oefening pas je PCA toe op de wine-gegevensset om te zien of je de nauwkeurigheid van het model kunt verhogen.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Cursus bekijken

Oefeninstructies

  • Maak een PCA-object aan.
  • Definieer de features (X) en labels (y) uit wine, waarbij je de labels in de kolom "Type" gebruikt.
  • Pas PCA toe op X_train en X_test, zonder datalek, en sla de getransformeerde waarden op als pca_X_train en pca_X_test.
  • Print het attribuut .explained_variance_ratio_ van pca om te controleren hoeveel variantie door elk component wordt verklaard.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)
Code bewerken en uitvoeren