1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în regresia cu statsmodels în Python

Connected

exercițiu

Calcularea mediilor pe categorii

O modalitate bună de a explora în profunzime variabilele categoriale este să calculezi statistici rezumative pentru fiecare categorie. De exemplu, poți calcula media și mediana variabilei răspuns, grupate după o variabilă categorială. Astfel, poți compara fiecare categorie în detaliu.

Aici vei analiza mediile grupate ale prețurilor locuințelor din setul de date imobiliare din Taiwan. Acest lucru te va ajuta să înțelegi rezultatul unei regresii liniare cu o variabilă categorială.

taiwan_real_estate este disponibil ca DataFrame pandas.

Instrucțiuni

100 XP
  • Grupează taiwan_real_estate după house_age_years și calculează prețul mediu (price_twd_msq) pentru fiecare grupă de vârstă. Atribuie rezultatul variabilei mean_price_by_age.
  • Afișează rezultatul și analizează datele obținute.