LoslegenKostenlos loslegen

Hauspreise mit PCA trennen

PCA und t-SNE sind beides Verfahren zur Merkmalsextraktion, aber PCA kann nur die lineare Struktur der Daten erfassen. In dieser Übung erstellst du ein PCA-Diagramm des vollständigen house_sales_df, damit du das Ergebnis mit der t-SNE-Ausgabe vergleichen kannst.

Denk daran: price ist die Zielvariable in house_sales_df. Es ist wichtig, sie zu entfernen, bevor du PCA auf die Daten anpasst.

Die Pakete tidyverse und ggfortify wurden für dich geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

  • Passe eine PCA an die Prädiktoren von house_sales_df an.
  • Verwende autoplot(), um die ersten beiden PCs zu plotten und den Preis über die Farbe zu kodieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))

# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
  scale_color_gradient(low="gray", high="blue")
Code bearbeiten und ausführen