ComeçarComece gratuitamente

Agrupar e recodificar valores

Há quase 150 valores distintos de evanston311.category. Mas algumas dessas categorias são semelhantes, com o formato "Categoria principal - Detalhes". Podemos ter uma noção melhor de quais solicitações são comuns se agregarmos por categoria principal.

Para fazer isso, crie uma tabela temporária recode mapeando valores distintos de category para novos valores de standardized. Faça com que os valores de standardized sejam a parte da categoria antes de um traço ('-'). Extraia esse valor com a função split_part():

split_part(string text, delimiter text, field int)

Você também precisará fazer uma limpeza adicional de alguns casos que não se encaixam nesse padrão.

Em seguida, a tabela evanston311 pode ser unida a recode para agrupar as solicitações pelos novos valores da categoria standardized.

Este exercício faz parte do curso

Análise exploratória de dados em SQL

Ver Curso

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

-- Fill in the command below with the name of the temp table
DROP TABLE IF EXISTS ___;

-- Create and name the temporary table
CREATE ___ ___ ___ AS
-- Write the select query to generate the table with distinct values of category and standardized values
  SELECT DISTINCT category, 
         ___(___(___, ___, ___)) AS standardized
    -- What table are you selecting the above values from?
    FROM ___;
    
-- Look at a few values before the next step
SELECT DISTINCT standardized 
  FROM recode
 WHERE standardized LIKE 'Trash%Cart'
    OR standardized LIKE 'Snow%Removal%';
Editar e executar código