Calcul des moyennes par catégorie
Une méthode efficace pour explorer davantage les variables catégorielles consiste à calculer des statistiques sommaires pour chaque catégorie. Par exemple, vous pouvez calculer la moyenne et la médiane de votre variable de réponse, regroupées par variable catégorielle. Vous pouvez ainsi comparer chaque catégorie plus en détail.
Ici, vous allez examiner les moyennes groupées pour les prix des logements dans l'ensemble de données sur l'immobilier à Taïwan. Cela vous aidera à comprendre le résultat d'une régression linéaire avec une variable catégorielle.
taiwan_real_estate est disponible sous forme de DataFrame pandas.
Cet exercice fait partie du cours
Introduction à la régression avec statsmodels en Python
Instructions
- Regroupez
taiwan_real_estateparhouse_age_yearset calculez le prix moyen (price_twd_msq) pour chaque tranche d’âge. Affectez le résultat àmean_price_by_age. - Affichez le résultat et examinez-le.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)