Melakukan join, pemfilteran, dan agregasi
Dalam latihan ini, Anda akan menggunakan apa yang telah dipelajari untuk menyusun himpunan data guna menyelidiki bagaimana jumlah keluhan pemanas yang masuk ke saluran 311 Kota New York bervariasi menurut suhu.
Selain tabel hpd311calls, data.db memiliki tabel weather dengan catatan suhu harian tertinggi dan terendah untuk NYC. Kita ingin mendapatkan jumlah panggilan bertipe heat/hot water per hari dengan suhu yang di-join. Ini dapat dilakukan dalam satu kueri, yang akan kita bangun bertahap.
Pada bagian pertama, kita akan mengambil data yang kita perlukan dari hpd311calls saja. Lalu, pada bagian kedua, kita akan memodifikasi kueri untuk melakukan join dengan data weather.
pandas telah diimpor sebagai pd, dan engine basis data telah dibuat sebagai engine.
Latihan ini adalah bagian dari kursus
Pemasukan Data yang Efisien dengan pandas
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Query to get heat/hot water call counts by created_date
query = """
SELECT hpd311calls.____,
____
FROM hpd311calls
____ hpd311calls.____ = ____
____ hpd311calls.____;
"""
# Query database and save results as df
df = ____
# View first 5 records
print(df.head())