1. Learn
  2. /
  3. 课程
  4. /
  5. Python 假设检验

Connected

道练习

可视化多类别

到目前为止,本章只考虑了两个类别之间数值变量的差异。当然,很多数据集包含的类别不止两个。在对多个类别进行检验之前,先做探索性数据分析(EDA)通常更有帮助,例如对每个分组计算汇总统计量,并使用箱线图可视化各类别的数值变量分布。

这里我们回到延迟发货的数据,关注每个包裹价格(pack_price)在三种运输方式(shipment_mode)之间的差异:"Air"、"Air Charter" 和 "Ocean"。

late_shipments 已提供;pandas 和 matplotlib.pyplot 已按常用别名导入,seaborn 以 sns 导入。

说明 1 / 共 3 个

undefined XP
    1
    2
    3
  • 按 shipment_mode 对 late_shipments 分组,计算每组的平均 pack_price,将结果保存为 xbar_pack_by_mode。