1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Regression in R

Connected

cvičení

Vizualizace mnoha proměnných

Jakmile začneš pracovat s více proměnnými, jejich společná vizualizace v jednom grafu se stává náročnější. Kromě os x a y pro dvě numerické proměnné můžeš použít barvu pro třetí numerickou proměnnou a fazetování pro kategorické proměnné. To je ale zhruba hranice, za kterou se grafy stávají těžko čitelnými. Existují i specializované typy grafů, jako jsou korelační heatmapy nebo grafy paralelních souřadnic, které zvládnou více proměnných najednou — poskytují ale méně informací o jednotlivých proměnných a pro vizualizaci předpovědí modelu příliš vhodné nejsou.

V tomto cvičení využiješ bodový graf naplno: zobrazíš cenu nemovitosti, vzdálenost k zastávce MRT, počet blízkých prodejen a stáří domu — vše najednou v jediném grafu.

Dataset taiwan_real_estate je k dispozici; balíček ggplot2 je načtený.

Pokyny

100 XP
  • Použij dataset taiwan_real_estate a vytvoř bodový graf závislosti n_convenience na odmocnině z dist_to_mrt_m, obarvený podle price_twd_msq.
  • Použij spojitou barevnou škálu viridis plasma.
  • Rozděl graf na fazety podle proměnné house_age_years.