Separando preços de casas com t-SNE

t-SNE é uma técnica de redução de dimensionalidade não linear. Ele projeta dados de alta dimensionalidade em um espaço de menor dimensionalidade. Ao fazer isso, busca manter pontos próximos de seus vizinhos originais. Você vai criar um gráfico de t-SNE para comparar com o gráfico de PCA do último exercício. PCA preserva a estrutura global dos dados, mas não a local. O t-SNE preserva a estrutura local mantendo vizinhos no espaço de maior dimensionalidade próximos uns dos outros no espaço de menor dimensionalidade. Você verá isso nos gráficos.

Você vai aplicar t-SNE para reduzir o house_sales_df. A variável-alvo de house_sales_df é price. Os pacotes tidyverse e Rtsne já foram carregados para você.

Este exercício faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercício

Ajuste o t-SNE ao house_sales_df usando Rtsne().
Una as coordenadas X e Y do t-SNE ao house_sales_df.
Plote os resultados do t-SNE usando ggplot(), codificando a variável-alvo na cor.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)

# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>% 
  ___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])

# Plot t-SNE
___ %>% 
  ___(aes(x = ___, y = ___, color = ___)) +
  geom_point() +
  scale_color_gradient(low="gray", high="blue")

Editar e executar o código