Unir tablas
Las tablas en bases de datos relacionales suelen tener columnas clave con identificadores únicos de registros. Esto nos permite crear canalizaciones que combinan tablas usando la operación JOIN de SQL, en lugar de tener que combinar los datos después de importarlos.
Los registros en hpd311calls a menudo tratan problemas, como fugas o calefacción, que se agravan con las condiciones meteorológicas. En este ejercicio, unirás los datos de weather a los registros de llamadas por sus columnas de fecha en común para tenerlo todo en un único dataframe. Puedes asumir que estas columnas tienen el mismo tipo de datos.
pandas está cargado como pd, y el motor de base de datos, engine, ya se ha creado.
Nota: El comprobador de SQL es estricto con el orden de las tablas en el join: espera tablas específicas a la izquierda y a la derecha.
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Instrucciones del ejercicio
- Completa la consulta para unir
weatherconhpd311callspor sus columnasdateycreated_date, respectivamente. - Consulta la base de datos y asigna el dataframe resultante a
calls_with_weather. - Imprime las primeras filas de
calls_with_weatherpara confirmar que se unieron todas las columnas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Query to join weather to call records by date columns
query = """
SELECT *
FROM hpd311calls
JOIN ____
ON hpd311calls.____ = ____.____;
"""
# Create dataframe of joined tables
calls_with_weather = ____
# View the dataframe to make sure all columns were joined
____