1. Learn
  2. /
  3. Курси
  4. /
  5. Розвідувальний аналіз даних у SQL

Connected

вправа

Групування та перекодування значень

У стовпці evanston311.category майже 150 різних значень. Проте частина з них подібна за формою «Основна категорія - Деталі». Щоб краще зрозуміти, які запити трапляються найчастіше, варто агрегувати за основною категорією.

Для цього створіть тимчасову таблицю recode, яка відображає унікальні значення category на нові, standardized. Зробіть standardized частиною категорії до дефіса ('-'). Витягніть це значення за допомогою функції split_part():

split_part(string text, delimiter text, field int)

Також потрібно додатково почистити кілька випадків, які не відповідають цьому шаблону.

Потім таблицю evanston311 можна обʼєднати з recode, щоб згрупувати запити за новими значеннями категорії standardized.

Інструкції 1/4

undefined XP
    1
    2
    3
    4
  • Створіть recode зі стовпцем standardized; використайте split_part(), а потім rtrim(), щоб прибрати зайві пробіли з результату split_part().