PCA verwenden

In dieser Übung wendest du PCA auf den wine-Datensatz an, um zu sehen, ob du die Genauigkeit des Modells steigern kannst.

Diese Übung ist Teil des Kurses

Vorverarbeitung für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

Erzeuge ein PCA-Objekt.
Definiere die Features (X) und Labels (y) aus wine, wobei die Labels in der Spalte "Type" stehen.
Wende PCA auf X_train und X_test an, achte auf kein Data Leakage, und speichere die transformierten Werte als pca_X_train und pca_X_test.
Gib das Attribut .explained_variance_ratio_ von pca aus, um zu prüfen, wie viel Varianz jede Komponente erklärt.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)

Code bearbeiten und ausführen