ComenzarEmpieza gratis

Separar precios de viviendas con t-SNE

t-SNE es una técnica no lineal de reducción de dimensionalidad. Proyecta datos de alta dimensión a un espacio de menor dimensión. En ese proceso, intenta mantener los puntos junto a sus vecinos originales. Crearás un gráfico de t-SNE que podrás comparar con el gráfico de PCA del ejercicio anterior. PCA preserva la estructura global de los datos, pero no la local. t-SNE preserva la estructura local manteniendo cercanos, en el espacio de menor dimensión, a los vecinos del espacio de mayor dimensión. Lo verás en los gráficos.

Aplicarás t-SNE para reducir house_sales_df. La variable objetivo de house_sales_df es price. Los paquetes tidyverse y Rtsne ya están cargados para ti.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Ajusta t-SNE a house_sales_df usando Rtsne().
  • Añade (bind) las coordenadas X e Y de t-SNE a house_sales_df.
  • Representa los resultados de t-SNE con ggplot(), codificando la variable objetivo en el color.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)

# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>% 
  ___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])

# Plot t-SNE
___ %>% 
  ___(aes(x = ___, y = ___, color = ___)) +
  geom_point() +
  scale_color_gradient(low="gray", high="blue")
Editar y ejecutar código