IniziaInizia gratis

Effettuare join tra tabelle

Nelle basi di dati relazionali, le tabelle hanno di solito colonne chiave con identificatori univoci dei record. Questo ci permette di costruire pipeline che combinano le tabelle usando l'operazione JOIN di SQL, invece di dover unire i dati dopo l'importazione.

I record in hpd311calls riguardano spesso problemi, come perdite o riscaldamento, che possono peggiorare con le condizioni meteo. In questo esercizio, farai una join dei dati weather con i record delle chiamate sulle rispettive colonne di data comuni per ottenere tutto in un unico dataframe. Puoi assumere che queste colonne abbiano lo stesso tipo di dato.

pandas è caricato come pd ed è stato creato il motore del database, engine.

Nota: Il correttore SQL è pignolo sull'ordine delle tabelle nella join: si aspetta tabelle specifiche a sinistra e a destra.

Questo esercizio fa parte del corso

Acquisizione dati semplificata con pandas

Visualizza il corso

Istruzioni dell'esercizio

  • Completa la query per unire weather a hpd311calls rispettivamente tramite le colonne date e created_date.
  • Interroga il database e assegna il dataframe risultante a calls_with_weather.
  • Stampa le prime righe di calls_with_weather per confermare che tutte le colonne siano state unite.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Query to join weather to call records by date columns
query = """
SELECT * 
  FROM hpd311calls
  JOIN ____ 
  ON hpd311calls.____ = ____.____;
"""

# Create dataframe of joined tables
calls_with_weather = ____

# View the dataframe to make sure all columns were joined
____
Modifica ed esegui il codice