1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do regresji z użyciem statsmodels w Pythonie

Connected

ćwiczenie

Obliczanie średnich według kategorii

Dobrym sposobem na głębsze poznanie zmiennych kategorycznych jest obliczenie statystyk podsumowujących dla każdej kategorii. Możesz na przykład obliczyć średnią i medianę zmiennej objaśnianej w podziale na grupy wyznaczone przez zmienną kategoryczną. Pozwala to dokładniej porównać poszczególne kategorie.

W tym ćwiczeniu przyjrzysz się średnim cenom nieruchomości pogrupowanym według kategorii w tajwańskim zbiorze danych o rynku nieruchomości. Pomoże ci to lepiej zrozumieć wyniki regresji liniowej ze zmienną kategoryczną.

taiwan_real_estate jest dostępny jako DataFrame biblioteki pandas.

Instrukcje

100 XP
  • Zgrupuj taiwan_real_estate według house_age_years i oblicz średnią cenę (price_twd_msq) dla każdej grupy wiekowej. Przypisz wynik do zmiennej mean_price_by_age.
  • Wydrukuj wynik i przeanalizuj dane wyjściowe.