Separare i prezzi delle case con t-SNE

t-SNE è una tecnica non lineare di riduzione della dimensionalità. Proietta dati ad alta dimensionalità in uno spazio a dimensionalità inferiore. Nel farlo, cerca di mantenere vicini i punti rispetto ai loro vicini originali. Creerai un grafico t-SNE che potrai confrontare con il grafico PCA dell’esercizio precedente. La PCA preserva la struttura globale dei dati, ma non quella locale. t-SNE preserva la struttura locale mantenendo vicini, nello spazio a bassa dimensionalità, i punti che erano vicini nello spazio a dimensionalità più alta. Lo vedrai nei grafici.

Applicherai t-SNE per ridurre house_sales_df. La variabile target di house_sales_df è price. I pacchetti tidyverse e Rtsne sono già stati caricati per te.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in R

Visualizza corso

Istruzioni dell'esercizio

Adatta t-SNE a house_sales_df usando Rtsne().
Unisci le coordinate X e Y di t-SNE a house_sales_df.
Rappresenta i risultati di t-SNE con ggplot(), codificando la variabile target nel colore.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)

# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>% 
  ___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])

# Plot t-SNE
___ %>% 
  ___(aes(x = ___, y = ___, color = ___)) +
  geom_point() +
  scale_color_gradient(low="gray", high="blue")

Modifica ed esegui il codice