Agrupar e recodificar valores
Há quase 150 valores distintos de evanston311.category
. Mas algumas dessas categorias são semelhantes, com o formato "Categoria principal - Detalhes". Podemos ter uma noção melhor de quais solicitações são comuns se agregarmos por categoria principal.
Para fazer isso, crie uma tabela temporária recode
mapeando valores distintos de category
para novos valores de standardized
. Faça com que os valores de standardized
sejam a parte da categoria antes de um traço ('-'
). Extraia esse valor com a função split_part()
:
split_part(string text, delimiter text, field int)
Você também precisará fazer uma limpeza adicional de alguns casos que não se encaixam nesse padrão.
Em seguida, a tabela evanston311
pode ser unida a recode
para agrupar as solicitações pelos novos valores da categoria standardized
.
Este exercício faz parte do curso
Análise exploratória de dados em SQL
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
-- Fill in the command below with the name of the temp table
DROP TABLE IF EXISTS ___;
-- Create and name the temporary table
CREATE ___ ___ ___ AS
-- Write the select query to generate the table with distinct values of category and standardized values
SELECT DISTINCT category,
___(___(___, ___, ___)) AS standardized
-- What table are you selecting the above values from?
FROM ___;
-- Look at a few values before the next step
SELECT DISTINCT standardized
FROM recode
WHERE standardized LIKE 'Trash%Cart'
OR standardized LIKE 'Snow%Removal%';