1. Learn
  2. /
  3. 课程
  4. /
  5. SQL 中的探索性数据分析

Connected

道练习

分组并重新编码取值

evanston311.category 中有近 150 个不同的取值。但其中有些类别格式相似,形如 "Main Category - Details"。如果按主类别聚合,能更清楚地看出常见的请求类型。

为此,请创建一个临时表 recode,将不同的 category 映射为新的 standardized 取值。standardized 的取值应为连接符('-')前面的那一部分。使用 split_part() 函数提取该部分:

split_part(string text, delimiter text, field int)

此外,您还需要对少数不符合该模式的情况做额外清理。

完成后,将 evanston311 表与 recode 连接,以按新的 standardized 类别取值对请求分组。

说明 1 / 共 4 个

undefined XP
    1
    2
    3
    4
  • 创建带有 standardized 列的 recode;先用 split_part(),再用 rtrim() 去除 split_part() 结果中残留的空白字符。