Raggruppa e ricodifica i valori
Ci sono quasi 150 valori distinti in evanston311.category. Alcune di queste categorie però sono simili e seguono la forma "Categoria principale - Dettagli". Possiamo capire meglio quali richieste sono più comuni se aggreghiamo per categoria principale.
Per farlo, crea una tabella temporanea recode che mappi i valori distinti di category su nuovi valori standardized. Imposta i valori standardized come la parte della categoria prima del trattino ('-'). Estrai questo valore con la funzione split_part():
split_part(string text, delimiter text, field int)
Dovrai anche fare un po' di pulizia aggiuntiva per alcuni casi che non seguono questo schema.
Poi potrai fare una JOIN della tabella evanston311 con recode per raggruppare le richieste in base ai nuovi valori di categoria standardized.
Questo esercizio fa parte del corso
Analisi esplorativa dei dati in SQL
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
-- Fill in the command below with the name of the temp table
DROP TABLE IF EXISTS ___;
-- Create and name the temporary table
CREATE ___ ___ ___ AS
-- Write the select query to generate the table with distinct values of category and standardized values
SELECT DISTINCT category,
___(___(___, ___, ___)) AS standardized
-- What table are you selecting the above values from?
FROM ___;
-- Look at a few values before the next step
SELECT DISTINCT standardized
FROM recode
WHERE standardized LIKE 'Trash%Cart'
OR standardized LIKE 'Snow%Removal%';