Effettuare join tra tabelle
Nelle basi di dati relazionali, le tabelle hanno di solito colonne chiave con identificatori univoci dei record. Questo ci permette di costruire pipeline che combinano le tabelle usando l'operazione JOIN di SQL, invece di dover unire i dati dopo l'importazione.
I record in hpd311calls riguardano spesso problemi, come perdite o riscaldamento, che possono peggiorare con le condizioni meteo. In questo esercizio, farai una join dei dati weather con i record delle chiamate sulle rispettive colonne di data comuni per ottenere tutto in un unico dataframe. Puoi assumere che queste colonne abbiano lo stesso tipo di dato.
pandas è caricato come pd ed è stato creato il motore del database, engine.
Nota: Il correttore SQL è pignolo sull'ordine delle tabelle nella join: si aspetta tabelle specifiche a sinistra e a destra.
Questo esercizio fa parte del corso
Acquisizione dati semplificata con pandas
Istruzioni dell'esercizio
- Completa la query per unire
weatherahpd311callsrispettivamente tramite le colonnedateecreated_date. - Interroga il database e assegna il dataframe risultante a
calls_with_weather. - Stampa le prime righe di
calls_with_weatherper confermare che tutte le colonne siano state unite.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Query to join weather to call records by date columns
query = """
SELECT *
FROM hpd311calls
JOIN ____
ON hpd311calls.____ = ____.____;
"""
# Create dataframe of joined tables
calls_with_weather = ____
# View the dataframe to make sure all columns were joined
____