Memisahkan harga rumah dengan t-SNE
t-SNE adalah teknik reduksi dimensi nonlinier. Teknik ini memetakan data berdimensi tinggi ke dalam ruang berdimensi lebih rendah. Saat melakukannya, t-SNE berupaya menjaga titik-titik tetap berdekatan dengan tetangga aslinya. Anda akan membuat plot t-SNE yang dapat dibandingkan dengan plot PCA pada latihan sebelumnya. PCA mempertahankan struktur global data, tetapi tidak struktur lokal. t-SNE mempertahankan struktur lokal dengan menjaga titik-titik yang bertetangga di ruang berdimensi lebih tinggi tetap berdekatan di ruang berdimensi lebih rendah. Anda akan melihat hal ini pada plot.
Anda akan menerapkan t-SNE untuk mereduksi house_sales_df. Variabel target dari house_sales_df adalah price. Paket tidyverse dan Rtsne telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Sesuaikan t-SNE pada
house_sales_dfmenggunakanRtsne(). - Ikat (bind) koordinat X dan Y t-SNE ke
house_sales_df. - Plot hasil t-SNE menggunakan
ggplot(), dengan menyandikan variabel target pada warna.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)
# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>%
___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])
# Plot t-SNE
___ %>%
___(aes(x = ___, y = ___, color = ___)) +
geom_point() +
scale_color_gradient(low="gray", high="blue")