Comece agoraComece grátis

Separando preços de casas com t-SNE

t-SNE é uma técnica de redução de dimensionalidade não linear. Ele projeta dados de alta dimensionalidade em um espaço de menor dimensionalidade. Ao fazer isso, busca manter pontos próximos de seus vizinhos originais. Você vai criar um gráfico de t-SNE para comparar com o gráfico de PCA do último exercício. PCA preserva a estrutura global dos dados, mas não a local. O t-SNE preserva a estrutura local mantendo vizinhos no espaço de maior dimensionalidade próximos uns dos outros no espaço de menor dimensionalidade. Você verá isso nos gráficos.

Você vai aplicar t-SNE para reduzir o house_sales_df. A variável-alvo de house_sales_df é price. Os pacotes tidyverse e Rtsne já foram carregados para você.

Este exercicio faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercicio

  • Ajuste o t-SNE ao house_sales_df usando Rtsne().
  • Una as coordenadas X e Y do t-SNE ao house_sales_df.
  • Plote os resultados do t-SNE usando ggplot(), codificando a variável-alvo na cor.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)

# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>% 
  ___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])

# Plot t-SNE
___ %>% 
  ___(aes(x = ___, y = ___, color = ___)) +
  geom_point() +
  scale_color_gradient(low="gray", high="blue")
Editar e Executar Código