Aplicar funciones para limpiar cadenas
A lo largo de este curso utilizaremos un conjunto de datos con 5000 registros de multas de aparcamiento de la ciudad de Nueva York almacenados en la tabla parking_violation.
Se está rediseñando un servicio para proporcionar a los destinatarios de las multas una copia impresa de la infracción. Para que la información se muestre con el formato correcto en el informe, algunos campos deben modificarse respecto a su representación en la base de datos. Los cambios son los siguientes:
- Para alinear bien el texto en el formulario, los valores de
violation_locationdeben tener 4 caracteres de longitud. - Todos los valores
P-U(pick-up truck) de la columnavehicle_body_typedeben sustituirse por el valor genéricoTRK. - Solo la primera letra de cada palabra de la columna
street_namedebe ir en mayúscula.
Se utilizarán las funciones LPAD(), REPLACE() e INITCAP() para aplicar estos cambios.
Este ejercicio forma parte del curso
Limpieza de datos en bases de datos PostgreSQL
Instrucciones del ejercicio
- Añade
'0'al principio de cualquierviolation_locationcuya longitud sea inferior a 4 dígitos usando la funciónLPAD(). - Sustituye
'P-U'por'TRK'en los valores de la columnavehicle_body_typeusando la funciónREPLACE(). - Asegúrate de que solo la primera letra de las palabras de la columna
street_nameesté en mayúscula usando la funciónINITCAP().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
SELECT
-- Add 0s to ensure violation_location is 4 characters in length
___(___, ___, ___) AS violation_location,
-- Replace 'P-U' with 'TRK' in vehicle_body_type column
___(___, ___, ___) AS vehicle_body_type,
-- Ensure only first letter capitalized in street_name
___(___) AS ___
FROM
parking_violation;