Resolver duplicados imparciales
El conjunto de datos parking_violation se ha modificado para incluir una columna fee que indica la tasa de la infracción. Esta columna sería útil para llevar el control de los ingresos por multas de aparcamiento de la ciudad de Nueva York. Sin embargo, debido a los registros de infracciones duplicados, los cálculos de ingresos basados en el conjunto de datos no serían precisos. Estos registros duplicados solo difieren en el valor de la columna fee. El resto de columnas comparten el mismo valor en los registros duplicados. Se ha decidido usar la fee mínima para resolver la ambigüedad creada por estos duplicados.
Identifica los 3 registros duplicados de parking_violation y usa la función MIN() para determinar la fee que se utilizará después de eliminar los registros duplicados.
Este ejercicio forma parte del curso
Limpieza de datos en bases de datos PostgreSQL
Instrucciones del ejercicio
- Devuelve el
summons_numbery lafeemínima para los registros duplicados. - Agrupa los resultados por
summons_number. - Restringe los resultados a los registros cuyo conteo de
summons_numbersea mayor que 1.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
SELECT
-- Include SELECT list columns
___,
___(___) AS fee
FROM
parking_violation
GROUP BY
-- Define column for GROUP BY
___
HAVING
-- Restrict to summons numbers with count greater than 1
___(___) ___ ___;