Memisahkan harga rumah dengan t-SNE

t-SNE adalah teknik reduksi dimensi nonlinier. Teknik ini memetakan data berdimensi tinggi ke dalam ruang berdimensi lebih rendah. Saat melakukannya, t-SNE berupaya menjaga titik-titik tetap berdekatan dengan tetangga aslinya. Anda akan membuat plot t-SNE yang dapat dibandingkan dengan plot PCA pada latihan sebelumnya. PCA mempertahankan struktur global data, tetapi tidak struktur lokal. t-SNE mempertahankan struktur lokal dengan menjaga titik-titik yang bertetangga di ruang berdimensi lebih tinggi tetap berdekatan di ruang berdimensi lebih rendah. Anda akan melihat hal ini pada plot.

Anda akan menerapkan t-SNE untuk mereduksi house_sales_df. Variabel target dari house_sales_df adalah price. Paket tidyverse dan Rtsne telah dimuat untuk Anda.

Latihan ini merupakan bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Instruksi latihan

Sesuaikan t-SNE pada house_sales_df menggunakan Rtsne().
Ikat (bind) koordinat X dan Y t-SNE ke house_sales_df.
Plot hasil t-SNE menggunakan ggplot(), dengan menyandikan variabel target pada warna.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)

# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>% 
  ___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])

# Plot t-SNE
___ %>% 
  ___(aes(x = ___, y = ___, color = ___)) +
  geom_point() +
  scale_color_gradient(low="gray", high="blue")

Edit dan Jalankan Kode