1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Separowanie cen domów za pomocą t-SNE

t-SNE to nieliniowa technika redukcji wymiarowości. Osadza dane wielowymiarowe w przestrzeni o mniejszej liczbie wymiarów, starając się przy tym zachować bliskość punktów, które były sąsiadami w oryginalnej przestrzeni. Stworzysz wykres t-SNE, który możesz porównać z wykresem PCA z poprzedniego ćwiczenia. PCA zachowuje globalną strukturę danych, ale nie lokalną. t-SNE zachowuje strukturę lokalną, utrzymując sąsiadów z przestrzeni wielowymiarowej blisko siebie w przestrzeni o mniejszej liczbie wymiarów. Zobaczysz to na wykresach.

Zastosujesz t-SNE, aby zredukować wymiarowość zbioru house_sales_df. Zmienną docelową w house_sales_df jest price. Pakiety tidyverse i Rtsne zostały już wczytane.

Instrukcje

100 XP
  • Dopasuj t-SNE do house_sales_df za pomocą Rtsne().
  • Połącz współrzędne X i Y t-SNE ze zbiorem house_sales_df.
  • Zwizualizuj wyniki t-SNE za pomocą ggplot(), kodując zmienną docelową kolorem.