1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Průzkumná analýza dat v SQL

Connected

Cvičení

Seskupení a překódování hodnot

Tabulka evanston311.category obsahuje téměř 150 různých hodnot. Některé kategorie jsou si ale podobné a mají formát „Hlavní kategorie - Podrobnosti". Pokud agregujeme podle hlavní kategorie, získáme lepší přehled o tom, jaké požadavky jsou nejčastější.

Vytvoř dočasnou tabulku recode, která mapuje jednotlivé hodnoty sloupce category na nové, standardized hodnoty. Jako standardized hodnotu použij část názvu kategorie před pomlčkou ('-'). Tuto část extrahuj pomocí funkce split_part():

split_part(string text, delimiter text, field int)

Několik případů, které do tohoto vzoru nezapadají, bude potřeba dočistit ručně.

Poté připoj tabulku evanston311 k tabulce recode a seskup požadavky podle nových standardized hodnot kategorie.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Vytvoř tabulku recode se sloupcem standardized; použij split_part() a poté rtrim(), aby se z výsledku split_part() odstranil případný zbývající bílý znak.