Aan de slagGa gratis aan de slag

Huizenprijzen scheiden met PCA

PCA en t-SNE zijn allebei technieken voor feature-extractie, maar PCA kan alleen de lineaire structuur van de data vastleggen. In deze oefening maak je een PCA-plot van de volledige house_sales_df zodat je het resultaat kunt vergelijken met de t-SNE-uitvoer.

Vergeet niet dat price de doelvariabele is in house_sales_df. Het is belangrijk om deze te verwijderen voordat je PCA op de data toepast.

De pakketten tidyverse en ggfortify zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Cursus bekijken

Oefeninstructies

  • Pas PCA toe op de voorspellende variabelen van house_sales_df.
  • Gebruik autoplot() om de eerste twee PC's te plotten en codeer de prijs in kleur.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))

# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
  scale_color_gradient(low="gray", high="blue")
Code bewerken en uitvoeren