PCA gebruiken
In deze oefening pas je PCA toe op de wine-gegevensset om te zien of je de nauwkeurigheid van het model kunt verhogen.
Deze oefening maakt deel uit van de cursus
Preprocessing voor Machine Learning in Python
Oefeninstructies
- Maak een
PCA-object aan. - Definieer de features (
X) en labels (y) uitwine, waarbij je de labels in de kolom"Type"gebruikt. - Pas PCA toe op
X_trainenX_test, zonder datalek, en sla de getransformeerde waarden op alspca_X_trainenpca_X_test. - Print het attribuut
.explained_variance_ratio_vanpcaom te controleren hoeveel variantie door elk component wordt verklaard.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)