PCA verwenden
In dieser Übung wendest du PCA auf den wine-Datensatz an, um zu sehen, ob du die Genauigkeit des Modells steigern kannst.
Diese Übung ist Teil des Kurses
Vorverarbeitung für Machine Learning in Python
Anleitung zur Übung
- Erzeuge ein
PCA-Objekt. - Definiere die Features (
X) und Labels (y) auswine, wobei die Labels in der Spalte"Type"stehen. - Wende PCA auf
X_trainundX_testan, achte auf kein Data Leakage, und speichere die transformierten Werte alspca_X_trainundpca_X_test. - Gib das Attribut
.explained_variance_ratio_vonpcaaus, um zu prüfen, wie viel Varianz jede Komponente erklärt.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Instantiate a PCA object
pca = ____()
# Define the features and labels from the wine dataset
X = wine.drop(____, ____)
y = wine["Type"]
X_train, X_test, y_train, y_test = train_test_split(X, y, stratify=y, random_state=42)
# Apply PCA to the wine dataset X vector
pca_X_train = ___.____(____)
pca_X_test = ___.____(____)
# Look at the percentage of variance explained by the different components
print(____)