Calcul des moyennes par catégorie
Une bonne façon d'explorer plus avant les variables catégorielles est de calculer des statistiques sommaires pour chaque catégorie. Par exemple, vous pouvez calculer la moyenne et la médiane de votre variable réponse, groupée par une variable catégorielle. Vous pouvez ainsi comparer chaque catégorie de manière plus détaillée.
Ici, vous allez examiner les moyennes groupées pour les prix des maisons dans l'ensemble de données immobilières de Taïwan. Cela vous aidera à comprendre le résultat d'une régression linéaire avec une variable catégorielle.
taiwan_real_estate
est disponible sous la forme d'un DataFrame pandas
.
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Instructions
- Regroupez
taiwan_real_estate
parhouse_age_years
et calculez le prix moyen (price_twd_msq
) pour chaque groupe d'âge. Affectez le résultat àmean_price_by_age
. - Imprimez le résultat et contrôlez la sortie.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)