Separare i prezzi delle case con t-SNE
t-SNE è una tecnica non lineare di riduzione della dimensionalità. Proietta dati ad alta dimensionalità in uno spazio a dimensionalità inferiore. Nel farlo, cerca di mantenere vicini i punti rispetto ai loro vicini originali. Creerai un grafico t-SNE che potrai confrontare con il grafico PCA dell’esercizio precedente. La PCA preserva la struttura globale dei dati, ma non quella locale. t-SNE preserva la struttura locale mantenendo vicini, nello spazio a bassa dimensionalità, i punti che erano vicini nello spazio a dimensionalità più alta. Lo vedrai nei grafici.
Applicherai t-SNE per ridurre house_sales_df. La variabile target di house_sales_df è price. I pacchetti tidyverse e Rtsne sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Adatta t-SNE a
house_sales_dfusandoRtsne(). - Unisci le coordinate X e Y di t-SNE a
house_sales_df. - Rappresenta i risultati di t-SNE con
ggplot(), codificando la variabile target nel colore.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)
# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>%
___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])
# Plot t-SNE
___ %>%
___(aes(x = ___, y = ___, color = ___)) +
geom_point() +
scale_color_gradient(low="gray", high="blue")