ComeçarComece de graça

Juntando tabelas

Tabelas em bancos de dados relacionais geralmente têm colunas-chave com identificadores únicos de registros. Isso nos permite criar pipelines que combinam tabelas usando a operação JOIN do SQL, em vez de precisar combinar dados depois de importá-los.

Os registros em hpd311calls frequentemente tratam de problemas, como vazamentos ou aquecimento, que pioram com as condições climáticas. Neste exercício, você vai juntar os dados de weather aos registros de chamadas pelas suas colunas de data em comum para obter tudo em um único dataframe. Você pode assumir que essas colunas têm o mesmo tipo de dado.

pandas está carregado como pd, e o mecanismo do banco, engine, já foi criado.

Observação: O verificador de SQL é exigente quanto à ordem das tabelas no join — ele espera tabelas específicas à esquerda e à direita.

Este exercício faz parte do curso

Ingestão de dados simplificada com pandas

Ver curso

Instruções do exercício

  • Complete a consulta para juntar weather a hpd311calls pelas colunas date e created_date, respectivamente.
  • Consulte o banco de dados e atribua o dataframe resultante a calls_with_weather.
  • Imprima as primeiras linhas de calls_with_weather para confirmar que todas as colunas foram unidas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Query to join weather to call records by date columns
query = """
SELECT * 
  FROM hpd311calls
  JOIN ____ 
  ON hpd311calls.____ = ____.____;
"""

# Create dataframe of joined tables
calls_with_weather = ____

# View the dataframe to make sure all columns were joined
____
Editar e executar o código