1. Learn
  2. /
  3. Cursuri
  4. /
  5. R 中的数据清洗

Connected

exercițiu

骑行时长范围约束

超出合理范围的取值会干扰分析,因此尽早发现它们非常重要。在本练习中,您将更仔细地检查 duration_min 列。单车一次不允许借出超过 24 小时,也就是 1440 分钟;但由于部分单车存在问题,归还时间被错误记录。

本练习中,您将把错误数据替换为范围上限(1440 分钟)。当然,您也可以把这些值替换为 NA。

已加载 dplyr、assertive 和 ggplot2,并已提供 bike_share_rides。

Instrucțiuni 1/2

undefined XP
    1
    2
  • 使用 ggplot2 对 bike_share_rides 的 duration_min 列绘制 3 个箱位的直方图,以识别是否存在超出范围的数据。