LoslegenKostenlos starten

Hauspreise mit PCA trennen

PCA und t-SNE sind beides Verfahren zur Merkmalsextraktion, aber PCA kann nur die lineare Struktur der Daten erfassen. In dieser Übung erstellst du ein PCA-Diagramm des vollständigen house_sales_df, damit du das Ergebnis mit der t-SNE-Ausgabe vergleichen kannst.

Denk daran: price ist die Zielvariable in house_sales_df. Es ist wichtig, sie zu entfernen, bevor du PCA auf die Daten anpasst.

Die Pakete tidyverse und ggfortify wurden für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Passe eine PCA an die Prädiktoren von house_sales_df an.
  • Verwende autoplot(), um die ersten beiden PCs zu plotten und den Preis über die Farbe zu kodieren.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))

# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
  scale_color_gradient(low="gray", high="blue")
Code bearbeiten und ausführen