PCA gebruiken

In deze oefening pas je PCA toe op de wine-gegevensset om te zien of je de nauwkeurigheid van het model kunt verhogen.

Deze oefening maakt deel uit van de cursus

Preprocessing voor Machine Learning in Python

Bekijk cursus

Oefeninstructies

Maak een PCA-object aan.
Definieer de features (X) en labels (y) uit wine, waarbij je de labels in de kolom "Type" gebruikt.
Pas PCA toe op X_train en X_test, zonder datalek, en sla de getransformeerde waarden op als pca_X_train en pca_X_test.
Print het attribuut .explained_variance_ratio_ van pca om te controleren hoeveel variantie door elk component wordt verklaard.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)

Code bewerken en uitvoeren