Separar precios de viviendas con t-SNE
t-SNE es una técnica no lineal de reducción de dimensionalidad. Proyecta datos de alta dimensión a un espacio de menor dimensión. En ese proceso, intenta mantener los puntos junto a sus vecinos originales. Crearás un gráfico de t-SNE que podrás comparar con el gráfico de PCA del ejercicio anterior. PCA preserva la estructura global de los datos, pero no la local. t-SNE preserva la estructura local manteniendo cercanos, en el espacio de menor dimensión, a los vecinos del espacio de mayor dimensión. Lo verás en los gráficos.
Aplicarás t-SNE para reducir house_sales_df. La variable objetivo de house_sales_df es price. Los paquetes tidyverse y Rtsne ya están cargados para ti.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Ajusta t-SNE a
house_sales_dfusandoRtsne(). - Añade (bind) las coordenadas X e Y de t-SNE a
house_sales_df. - Representa los resultados de t-SNE con
ggplot(), codificando la variable objetivo en el color.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)
# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>%
___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])
# Plot t-SNE
___ %>%
___(aes(x = ___, y = ___, color = ___)) +
geom_point() +
scale_color_gradient(low="gray", high="blue")