MulaiMulai sekarang secara gratis

Menggabungkan tabel

Tabel dalam basis data relasional biasanya memiliki kolom kunci sebagai pengenal unik setiap rekaman. Ini memungkinkan kita membangun pipeline yang menggabungkan tabel menggunakan operasi JOIN di SQL, alih-alih harus menggabungkan data setelah mengimpornya.

Rekaman di hpd311calls sering membahas masalah, seperti kebocoran atau gangguan pemanas, yang diperparah oleh kondisi cuaca. Pada latihan ini, Anda akan menggabungkan data weather ke rekaman panggilan berdasarkan kolom tanggal yang sama untuk mendapatkan semuanya dalam satu dataframe. Anda boleh mengasumsikan kolom-kolom tersebut memiliki tipe data yang sama.

pandas telah dimuat sebagai pd, dan mesin basis data, engine, sudah dibuat.

Catatan: Pemeriksa SQL cukup ketat terkait urutan tabel pada join — ia mengharapkan tabel tertentu berada di kiri dan kanan.

Latihan ini adalah bagian dari kursus

Pemasukan Data yang Efisien dengan pandas

Lihat Kursus

Petunjuk latihan

  • Lengkapi kueri untuk menggabungkan weather ke hpd311calls masing-masing berdasarkan kolom date dan created_date.
  • Kueri basis data dan simpan dataframe hasilnya ke calls_with_weather.
  • Cetak beberapa baris pertama dari calls_with_weather untuk memastikan semua kolom telah tergabung.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Query to join weather to call records by date columns
query = """
SELECT * 
  FROM hpd311calls
  JOIN ____ 
  ON hpd311calls.____ = ____.____;
"""

# Create dataframe of joined tables
calls_with_weather = ____

# View the dataframe to make sure all columns were joined
____
Edit dan Jalankan Kode