1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do regrese s knihovnou statsmodels v Pythonu

Connected

cvičení

Výpočet průměrů podle kategorií

Skvělý způsob, jak lépe prozkoumat kategorické proměnné, je vypočítat souhrnné statistiky pro každou kategorii. Můžeš například spočítat průměr a medián své závislé proměnné seskupené podle kategorické proměnné, a tím podrobněji porovnat jednotlivé kategorie.

Tady se podíváš na průměrné ceny nemovitostí v tchajwanském datasetu nemovitostí seskupené podle kategorií. To ti pomůže lépe pochopit výstup lineární regrese s kategorickou proměnnou.

taiwan_real_estate je k dispozici jako pandas DataFrame.

Pokyny

100 XP
  • Seskup taiwan_real_estate podle house_age_years a vypočítej průměrnou cenu (price_twd_msq) pro každou věkovou skupinu. Výsledek ulož do proměnné mean_price_by_age.
  • Výsledek vypiš a prozkoumej výstup.