1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do regresji z użyciem statsmodels w Pythonie

Connected

ćwiczenie

Wizualizacja dwóch zmiennych numerycznych

Zanim uruchomisz jakikolwiek model statystyczny, warto najpierw zwizualizować zbiór danych. Przyjrzysz się tutaj zależności między ceną nieruchomości za metr kwadratowy a liczbą pobliskich sklepów convenience, korzystając z tajwańskiego zbioru danych o nieruchomościach.

Jednym z wyzwań w tym zbiorze jest to, że liczba sklepów convenience zawiera dane całkowite, przez co punkty nakładają się na siebie. Aby temu zaradzić, nadasz punktom przezroczystość.

taiwan_real_estate jest dostępny jako pandas DataFrame.

Instrukcje 1/2

undefined XP
    1
    2
  • Zaimportuj pakiet seaborn, nadając mu alias sns.
  • Korzystając z taiwan_real_estate, narysuj wykres rozrzutu, gdzie na osi y znajdzie się "price_twd_msq", a na osi x – "n_convenience".