1. Nauka
  2. /
  3. Kursy
  4. /
  5. Regresja średnio zaawansowana w R

Connected

ćwiczenie

Wizualizacja wielu zmiennych

Gdy zaczynasz uwzględniać coraz więcej zmiennych, pokazanie ich wszystkich naraz staje się coraz trudniejsze. Oprócz osi x i y, które służą do przedstawiania dwóch zmiennych liczbowych, możesz użyć koloru dla trzeciej zmiennej liczbowej, a do zmiennych kategorycznych – podziału na panele (faceting). To mniej więcej granica, za którą wykresy stają się zbyt trudne do interpretacji. Istnieją co prawda specjalistyczne typy wykresów, takie jak mapy ciepła korelacji czy wykresy współrzędnych równoległych, które obsługują więcej zmiennych – jednak dostarczają znacznie mniej informacji o każdej z nich i nie sprawdzają się dobrze przy wizualizacji prognoz modelu.

W tym ćwiczeniu wykorzystasz możliwości wykresu punktowego do granic, przedstawiając jednocześnie cenę domu, odległość od stacji MRT, liczbę pobliskich sklepów convenience oraz wiek budynku.

Zbiór danych taiwan_real_estate jest dostępny; biblioteka ggplot2 jest załadowana.

Instrukcje

100 XP
  • Korzystając ze zbioru danych taiwan_real_estate, narysuj wykres punktowy n_convenience względem pierwiastka kwadratowego z dist_to_mrt_m, kolorując punkty według price_twd_msq.
  • Użyj ciągłej skali kolorów viridis plasma.
  • Podziel wykres na panele według zmiennej house_age_years.