Hauspreise mit PCA trennen
PCA und t-SNE sind beides Verfahren zur Merkmalsextraktion, aber PCA kann nur die lineare Struktur der Daten erfassen. In dieser Übung erstellst du ein PCA-Diagramm des vollständigen house_sales_df, damit du das Ergebnis mit der t-SNE-Ausgabe vergleichen kannst.
Denk daran: price ist die Zielvariable in house_sales_df. Es ist wichtig, sie zu entfernen, bevor du PCA auf die Daten anpasst.
Die Pakete tidyverse und ggfortify wurden für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Passe eine PCA an die Prädiktoren von
house_sales_dfan. - Verwende
autoplot(), um die ersten beiden PCs zu plotten und den Preis über die Farbe zu kodieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))
# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
scale_color_gradient(low="gray", high="blue")