1. Apprendre
  2. /
  3. Cours
  4. /
  5. Introduction à la régression avec statsmodels en Python

Connected

Exercice

Calculer des moyennes par catégorie

Une bonne façon d'explorer plus à fond les variables catégorielles est de calculer des statistiques sommaires pour chaque catégorie. Par exemple, vous pouvez calculer la moyenne et la médiane de votre variable de réponse, regroupées selon une variable catégorielle. Ainsi, vous pouvez comparer chaque catégorie plus en détail.

Ici, vous allez examiner les moyennes regroupées pour les prix des maisons dans l'ensemble de données sur l'immobilier à Taïwan. Cela vous aidera à comprendre la sortie d'une régression linéaire avec une variable catégorielle.

taiwan_real_estate est disponible comme DataFrame pandas.

Instructions

100 XP
  • Regroupez taiwan_real_estate par house_age_years et calculez le prix moyen (price_twd_msq) pour chaque groupe d'âge. Attribuez le résultat à mean_price_by_age.
  • Affichez le résultat et examinez la sortie.