1. Learn
  2. /
  3. Cursuri
  4. /
  5. Analiza Exploratorie a Datelor în SQL

Connected

exercițiu

Grupează și recodifică valorile

Există aproape 150 de valori distincte ale evanston311.category. Unele dintre aceste categorii sunt similare, având forma "Categorie principală - Detalii". Putem înțelege mai bine care cereri sunt frecvente dacă agregăm după categoria principală.

Pentru asta, creează un tabel temporar recode care mapează valorile distincte ale category la valori noi, standardized. Folosește ca valori standardized partea din categorie care apare înainte de cratimă ('-'). Extrage această valoare cu funcția split_part():

split_part(string text, delimiter text, field int)

Va fi nevoie și de câțiva pași suplimentari de curățare a datelor pentru cazurile care nu se potrivesc acestui tipar.

Apoi, tabelul evanston311 poate fi unit cu recode pentru a grupa cererile după noile valori standardized ale categoriei.

Instrucțiuni 1/4

undefined XP
    1
    2
    3
    4
  • Creează recode cu o coloană standardized; folosește split_part() și apoi rtrim() pentru a elimina eventualele spații rămase din rezultatul funcției split_part().