CommencerCommencer gratuitement

Calcul des moyennes par catégorie

Une méthode efficace pour explorer davantage les variables catégorielles consiste à calculer des statistiques sommaires pour chaque catégorie. Par exemple, vous pouvez calculer la moyenne et la médiane de votre variable de réponse, regroupées par variable catégorielle. Vous pouvez ainsi comparer chaque catégorie plus en détail.

Ici, vous allez examiner les moyennes groupées pour les prix des logements dans l'ensemble de données sur l'immobilier à Taïwan. Cela vous aidera à comprendre le résultat d'une régression linéaire avec une variable catégorielle.

taiwan_real_estate est disponible sous forme de DataFrame pandas.

Cet exercice fait partie du cours

Introduction à la régression avec statsmodels en Python

Afficher le cours

Instructions

  • Regroupez taiwan_real_estate par house_age_years et calculez le prix moyen (price_twd_msq) pour chaque tranche d’âge. Affectez le résultat à mean_price_by_age.
  • Affichez le résultat et examinez-le.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Modifier et exécuter le code