IniziaInizia gratis

Raggruppa e ricodifica i valori

Ci sono quasi 150 valori distinti in evanston311.category. Alcune di queste categorie però sono simili e seguono la forma "Categoria principale - Dettagli". Possiamo capire meglio quali richieste sono più comuni se aggreghiamo per categoria principale.

Per farlo, crea una tabella temporanea recode che mappi i valori distinti di category su nuovi valori standardized. Imposta i valori standardized come la parte della categoria prima del trattino ('-'). Estrai questo valore con la funzione split_part():

split_part(string text, delimiter text, field int)

Dovrai anche fare un po' di pulizia aggiuntiva per alcuni casi che non seguono questo schema.

Poi potrai fare una JOIN della tabella evanston311 con recode per raggruppare le richieste in base ai nuovi valori di categoria standardized.

Questo esercizio fa parte del corso

Analisi esplorativa dei dati in SQL

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

-- Fill in the command below with the name of the temp table
DROP TABLE IF EXISTS ___;

-- Create and name the temporary table
CREATE ___ ___ ___ AS
-- Write the select query to generate the table with distinct values of category and standardized values
  SELECT DISTINCT category, 
         ___(___(___, ___, ___)) AS standardized
    -- What table are you selecting the above values from?
    FROM ___;
    
-- Look at a few values before the next step
SELECT DISTINCT standardized 
  FROM recode
 WHERE standardized LIKE 'Trash%Cart'
    OR standardized LIKE 'Snow%Removal%';
Modifica ed esegui il codice