1. Nauka
  2. /
  3. Kursy
  4. /
  5. R 中的假设检验

Connected

ćwiczenie

可视化多个类别

到目前为止,本章只讨论了数值变量在两个类别之间的差异。当然,很多数据集包含更多类别。在对多个类别进行检验之前,通常先做探索性数据分析会更有帮助。也就是说,针对每个分组计算汇总统计量,并使用箱线图可视化该数值变量在各类别中的分布。

这里,我们回到延迟发货数据,考察每个包裹价格(pack_price)在三种运输方式(shipment_mode)之间的差异:"Air"、"Air Charter" 和 "Ocean"。

已提供 late_shipments,并已加载 dplyr 和 ggplot2。

Instrukcje 1/2

undefined XP
    1
    2
  • 使用 late_shipments 数据集,按 shipment_mode 分组。
  • 汇总计算 pack_price 的均值为 xbar_pack_price,标准差为 s_pack_price。