1. Nauka
  2. /
  3. Kursy
  4. /
  5. Eksploracyjna analiza danych w SQL

Connected

ćwiczenie

Grupowanie i przekodowywanie wartości

Tabela evanston311.category zawiera prawie 150 różnych wartości. Niektóre kategorie są jednak podobne i mają postać „Kategoria główna – Szczegóły". Żeby lepiej zorientować się, jakie zgłoszenia są najczęstsze, warto zagregować dane według kategorii głównej.

W tym celu utwórz tymczasową tabelę recode, która przypisze każdej unikalnej wartości category nową, standardized (ustandaryzowaną) wartość. Jako wartości standardized użyj części nazwy kategorii znajdującej się przed myślnikiem ('-'). Wyodrębnisz ją za pomocą funkcji split_part():

split_part(string text, delimiter text, field int)

Konieczne będzie też dodatkowe porządkowanie kilku przypadków, które nie pasują do tego wzorca.

Następnie połącz tabelę evanston311 z tabelą recode, aby pogrupować zgłoszenia według nowych, ustandaryzowanych wartości kategorii.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Utwórz tabelę recode z kolumną standardized; użyj funkcji split_part(), a następnie rtrim(), aby usunąć ewentualne białe znaki z wyniku split_part().