1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Redukce dimenzionality v R

Connected

Cvičení

Oddělení cen nemovitostí pomocí UMAP

Právě jsi snížil/a dimenzionalitu dat o prodeji kalifornských nemovitostí (house_sales_df) pomocí PCA a t-SNE. Teď to samé provedeš pomocí UMAP. Výsledek UMAP je velmi podobný t-SNE, ale UMAP bývá výpočetně efektivnější. Navíc lépe zachovává globální strukturu dat. V praxi to znamená, že vzdálenost mezi shluky lze interpretovat jako míru podobnosti — což u t-SNE nebylo možné.

Mez na paměti, že cílová proměnná v house_sales_df je price. Nastav num_comp = 2. Balíčky tidyverse a embed jsou již načteny.

Pokyny

100 XP
  • Natrénuj UMAP na všechny prediktory v house_sales_df pomocí step_umap() v receptu a transformovaná data ulož do umap_df.
  • Vykresli dimenze UMAP pomocí ggplot() a zakóduj cílovou proměnnou price barvou.