1. Learn
  2. /
  3. 课程
  4. /
  5. SQL 中的探索性数据分析

Connected

道练习

糟糕,老鼠!

类别 "Rodents- Rats" 中的请求平均需要超过 64 天才能解决。为什么?

分 4 步探究:

  1. 为什么平均值这么高?请检查完成时间的分布。提示:date_trunc() 也可用于 interval 类型。

  2. 观察排除离群值后,对平均完成时间的影响。

  3. 繁忙月份提交的请求是否更耗时?请检查平均完成时间与每月请求量之间的相关性。

  4. 比较每月创建的请求数量与每月完成的数量。

请记住:解决用时(完成时间)为 date_completed - date_created。

说明 1/4

undefined XP
  • 1
    • 使用 date_trunc() 按天数查看老鼠相关请求的完成时间分布。
  • 2
    • 计算按类别分组的平均完成时间,但排除用时最长的 5% 请求(离群值)。
  • 3
    • 计算平均完成时间与每月请求量之间的 corr()。EXTRACT(epoch FROM interval) 会返回 interval 的秒数。
  • 4
    • 选取每月创建的请求数量以及每月完成的请求数量。