LoslegenKostenlos loslegen

PCA verwenden

In dieser Übung wendest du PCA auf den wine-Datensatz an, um zu sehen, ob du die Genauigkeit des Modells steigern kannst.

Diese Übung ist Teil des Kurses

Vorverarbeitung für Machine Learning in Python

Kurs anzeigen

Anleitung zur Übung

  • Erzeuge ein PCA-Objekt.
  • Definiere die Features (X) und Labels (y) aus wine, wobei die Labels in der Spalte "Type" stehen.
  • Wende PCA auf X_train und X_test an, achte auf kein Data Leakage, und speichere die transformierten Werte als pca_X_train und pca_X_test.
  • Gib das Attribut .explained_variance_ratio_ von pca aus, um zu prüfen, wie viel Varianz jede Komponente erklärt.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Instantiate a PCA object
pca = ____()

# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]

X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)

# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)

# Look at the percentage of variance explained by the different components
print(____)
Code bearbeiten und ausführen