Agrupar e recodificar valores
Há quase 150 valores distintos em evanston311.category. Mas algumas dessas categorias são parecidas, no formato "Categoria principal - Detalhes". Podemos entender melhor quais solicitações são mais comuns se agregarmos pela categoria principal.
Para isso, crie uma tabela temporária recode que faça o mapeamento dos valores distintos de category para novos valores standardized. Defina os valores de standardized como a parte da categoria antes do hífen ('-'). Extraia esse valor com a função split_part():
split_part(string text, delimiter text, field int)
Você também vai precisar fazer uma limpeza adicional em alguns casos que não se encaixam nesse padrão.
Depois, a tabela evanston311 pode ser combinada com recode para agrupar as solicitações pelos novos valores standardized.
Este exercício faz parte do curso
Análise Exploratória de Dados em SQL
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
-- Fill in the command below with the name of the temp table
DROP TABLE IF EXISTS ___;
-- Create and name the temporary table
CREATE ___ ___ ___ AS
-- Write the select query to generate the table with distinct values of category and standardized values
SELECT DISTINCT category,
___(___(___, ___, ___)) AS standardized
-- What table are you selecting the above values from?
FROM ___;
-- Look at a few values before the next step
SELECT DISTINCT standardized
FROM recode
WHERE standardized LIKE 'Trash%Cart'
OR standardized LIKE 'Snow%Removal%';