Juntando tabelas
Tabelas em bancos de dados relacionais geralmente têm colunas-chave com identificadores únicos de registros. Isso nos permite criar pipelines que combinam tabelas usando a operação JOIN do SQL, em vez de precisar combinar dados depois de importá-los.
Os registros em hpd311calls frequentemente tratam de problemas, como vazamentos ou aquecimento, que pioram com as condições climáticas. Neste exercício, você vai juntar os dados de weather aos registros de chamadas pelas suas colunas de data em comum para obter tudo em um único dataframe. Você pode assumir que essas colunas têm o mesmo tipo de dado.
pandas está carregado como pd, e o mecanismo do banco, engine, já foi criado.
Observação: O verificador de SQL é exigente quanto à ordem das tabelas no join — ele espera tabelas específicas à esquerda e à direita.
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Instruções do exercício
- Complete a consulta para juntar
weatherahpd311callspelas colunasdateecreated_date, respectivamente. - Consulte o banco de dados e atribua o dataframe resultante a
calls_with_weather. - Imprima as primeiras linhas de
calls_with_weatherpara confirmar que todas as colunas foram unidas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Query to join weather to call records by date columns
query = """
SELECT *
FROM hpd311calls
JOIN ____
ON hpd311calls.____ = ____.____;
"""
# Create dataframe of joined tables
calls_with_weather = ____
# View the dataframe to make sure all columns were joined
____