CommencerCommencer gratuitement

Calcul des moyennes par catégorie

Une bonne façon d'explorer plus avant les variables catégorielles est de calculer des statistiques sommaires pour chaque catégorie. Par exemple, vous pouvez calculer la moyenne et la médiane de votre variable réponse, groupée par une variable catégorielle. Vous pouvez ainsi comparer chaque catégorie de manière plus détaillée.

Ici, vous allez examiner les moyennes groupées pour les prix des maisons dans l'ensemble de données immobilières de Taïwan. Cela vous aidera à comprendre le résultat d'une régression linéaire avec une variable catégorielle.

taiwan_real_estate est disponible sous la forme d'un DataFrame pandas.

Cet exercice fait partie du cours

Introduction à la régression avec statsmodels en Python

Afficher le cours

Instructions

  • Regroupez taiwan_real_estate par house_age_years et calculez le prix moyen (price_twd_msq) pour chaque groupe d'âge. Affectez le résultat à mean_price_by_age.
  • Imprimez le résultat et contrôlez la sortie.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Modifier et exécuter le code