Separare i prezzi delle case con la PCA
PCA e t-SNE sono entrambe tecniche di estrazione delle caratteristiche, ma la PCA può catturare solo la struttura lineare dei dati. In questo esercizio, creerai un grafico PCA dell'intero house_sales_df così potrai confrontarne il risultato con l'output di t-SNE.
Ricorda che price è la variabile target in house_sales_df. È importante rimuoverla prima di adattare la PCA ai dati.
I pacchetti tidyverse e ggfortify sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Adatta una PCA ai predittori di
house_sales_df. - Usa
autoplot()per tracciare le prime due PC e codificapricenel colore.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit PCA to only the predictors
pca <- ___(___ %>% select(-___))
# Plot PCA and color code the target variable
___(___, data = ___, colour = "___", alpha = 0.7) +
scale_color_gradient(low="gray", high="blue")