1. Nauka
  2. /
  3. Kursy
  4. /
  5. Regresja średnio zaawansowana ze statsmodels w Pythonie

Connected

ćwiczenie

Wizualizacja wielu zmiennych

Wraz z rosnącą liczbą zmiennych jednoczesne przedstawienie ich wszystkich na wykresie staje się coraz trudniejsze. Do dwóch zmiennych numerycznych możesz wykorzystać osie x i y, trzecią zmienną numeryczną możesz zakodować kolorem, a zmienne kategoryczne – fasetowaniem. To mniej więcej górna granica czytelności. Istnieją wyspecjalizowane typy wykresów, takie jak mapy ciepła korelacji czy wykresy współrzędnych równoległych, które radzą sobie z większą liczbą zmiennych – jednak dostarczają znacznie mniej informacji o każdej z nich i nie sprawdzają się najlepiej przy wizualizacji prognoz modelu.

W tym ćwiczeniu sprawdzisz, ile zmiennych możesz zmieścić na wykresie punktowym – przedstawisz jednocześnie cenę nieruchomości, odległość do stacji MRT, liczbę pobliskich sklepów oraz wiek budynku.

Zbiór danych taiwan_real_estate jest dostępny.

Instrukcje

100 XP
  • Utwórz siatkę fasetową dla każdej wartości house_age_years ze zbioru taiwan_real_estate.
  • Korzystając ze zbioru danych taiwan_real_estate, narysuj wykres punktowy zależności n_convenience od sqrt_dist_to_mrt_m, z kolorem zależnym od price_twd_msq.