1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Separace cen domů pomocí t-SNE

t-SNE je nelineární technika redukce dimenzionality. Vkládá vícerozměrná data do prostoru s nižším počtem dimenzí a přitom se snaží zachovat sousedství jednotlivých bodů. Vytvoříš graf t-SNE, který pak porovnáš s grafem PCA z předchozího cvičení. PCA zachovává globální strukturu dat, ale ne lokální. t-SNE naopak zachovává lokální strukturu tím, že body, které jsou si blízko ve vícerozměrném prostoru, zůstanou blízko i v prostoru s nižší dimenzionalitou. To uvidíš přímo v grafech.

Aplikuješ t-SNE na redukci datasetu house_sales_df. Cílová proměnná house_sales_df je price. Balíčky tidyverse a Rtsne jsou už načtené.

Pokyny

100 XP
  • Natrénuj t-SNE na datasetu house_sales_df pomocí Rtsne().
  • Připoj souřadnice X a Y t-SNE k datasetu house_sales_df.
  • Vizualizuj výsledky t-SNE pomocí ggplot() a zakóduj cílovou proměnnou barvou.