Huizenprijzen scheiden met PCA
PCA en t-SNE zijn allebei technieken voor feature-extractie, maar PCA kan alleen de lineaire structuur van de data vastleggen. In deze oefening maak je een PCA-plot van de volledige house_sales_df zodat je het resultaat kunt vergelijken met de t-SNE-uitvoer.
Vergeet niet dat price de doelvariabele is in house_sales_df. Het is belangrijk om deze te verwijderen voordat je PCA op de data toepast.
De pakketten tidyverse en ggfortify zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in R
Oefeninstructies
- Pas PCA toe op de voorspellende variabelen van
house_sales_df. - Gebruik
autoplot()om de eerste twee PC's te plotten en codeer de prijs in kleur.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))
# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
scale_color_gradient(low="gray", high="blue")