Aan de slagBegin gratis

Huizenprijzen scheiden met PCA

PCA en t-SNE zijn allebei technieken voor feature-extractie, maar PCA kan alleen de lineaire structuur van de data vastleggen. In deze oefening maak je een PCA-plot van de volledige house_sales_df zodat je het resultaat kunt vergelijken met de t-SNE-uitvoer.

Vergeet niet dat price de doelvariabele is in house_sales_df. Het is belangrijk om deze te verwijderen voordat je PCA op de data toepast.

De pakketten tidyverse en ggfortify zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Bekijk cursus

Oefeninstructies

  • Pas PCA toe op de voorspellende variabelen van house_sales_df.
  • Gebruik autoplot() om de eerste twee PC's te plotten en codeer de prijs in kleur.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))

# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
  scale_color_gradient(low="gray", high="blue")
Code bewerken en uitvoeren