1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 Python 中的 statsmodels 进行回归入门

Connected

道练习

按类别计算均值

进一步探索分类变量的一个好方法是为每个类别计算汇总统计量。 例如,您可以按某个分类变量对响应变量分组,并分别计算其均值和中位数。这样,您就能更细致地比较各个类别。

在这里,您将查看台湾房地产数据集中房价的分组均值。这将帮助您理解含有分类变量的线性回归输出。

taiwan_real_estate 已作为一个 pandas DataFrame 提供。

说明

100 XP
  • 按 house_age_years 对 taiwan_real_estate 分组,并为每个年龄组计算价格(price_twd_msq)的均值。将结果赋给 mean_price_by_age。
  • 打印结果并查看输出。