MulaiMulai sekarang secara gratis

Memisahkan harga rumah dengan t-SNE

t-SNE adalah teknik reduksi dimensi nonlinier. Teknik ini memetakan data berdimensi tinggi ke dalam ruang berdimensi lebih rendah. Saat melakukannya, t-SNE berupaya menjaga titik-titik tetap berdekatan dengan tetangga aslinya. Anda akan membuat plot t-SNE yang dapat dibandingkan dengan plot PCA pada latihan sebelumnya. PCA mempertahankan struktur global data, tetapi tidak struktur lokal. t-SNE mempertahankan struktur lokal dengan menjaga titik-titik yang bertetangga di ruang berdimensi lebih tinggi tetap berdekatan di ruang berdimensi lebih rendah. Anda akan melihat hal ini pada plot.

Anda akan menerapkan t-SNE untuk mereduksi house_sales_df. Variabel target dari house_sales_df adalah price. Paket tidyverse dan Rtsne telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Petunjuk latihan

  • Sesuaikan t-SNE pada house_sales_df menggunakan Rtsne().
  • Ikat (bind) koordinat X dan Y t-SNE ke house_sales_df.
  • Plot hasil t-SNE menggunakan ggplot(), dengan menyandikan variabel target pada warna.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Fit t-SNE
set.seed(1234)
tsne <- ___(___ %>% select(-___), check_duplicates = FALSE)

# Bind t-SNE coordinates to the data frame
tsne_df <- ___ %>% 
  ___(tsne_x = ___$___[,___], tsne_y = ___$___[,___])

# Plot t-SNE
___ %>% 
  ___(aes(x = ___, y = ___, color = ___)) +
  geom_point() +
  scale_color_gradient(low="gray", high="blue")
Edit dan Jalankan Kode