Resolver duplicados imparciales

El conjunto de datos parking_violation se ha modificado para incluir una columna fee que indica la tasa de la infracción. Esta columna sería útil para llevar el control de los ingresos por multas de aparcamiento de la ciudad de Nueva York. Sin embargo, debido a los registros de infracciones duplicados, los cálculos de ingresos basados en el conjunto de datos no serían precisos. Estos registros duplicados solo difieren en el valor de la columna fee. El resto de columnas comparten el mismo valor en los registros duplicados. Se ha decidido usar la fee mínima para resolver la ambigüedad creada por estos duplicados.

Identifica los 3 registros duplicados de parking_violation y usa la función MIN() para determinar la fee que se utilizará después de eliminar los registros duplicados.

Este ejercicio forma parte del curso

Limpieza de datos en bases de datos PostgreSQL

Ver curso

Instrucciones del ejercicio

Devuelve el summons_number y la fee mínima para los registros duplicados.
Agrupa los resultados por summons_number.
Restringe los resultados a los registros cuyo conteo de summons_number sea mayor que 1.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

SELECT 
	-- Include SELECT list columns
	___, 
    ___(___) AS fee
FROM 
	parking_violation 
GROUP BY
	-- Define column for GROUP BY
	___ 
HAVING 
	-- Restrict to summons numbers with count greater than 1
	___(___) ___ ___;

Editar y ejecutar código