1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Nối bảng

Trong cơ sở dữ liệu quan hệ, các bảng thường có cột khóa làm định danh duy nhất cho bản ghi. Nhờ đó, bạn có thể xây dựng pipeline để kết hợp các bảng bằng thao tác JOIN của SQL, thay vì phải gộp dữ liệu sau khi nhập về.

Các bản ghi trong hpd311calls thường liên quan đến các sự cố như rò rỉ hay vấn đề sưởi ấm, vốn có thể trầm trọng hơn do thời tiết. Trong bài tập này, bạn sẽ nối dữ liệu weather vào các bản ghi cuộc gọi theo các cột ngày chung để gom mọi thứ vào một dataframe. Bạn có thể giả định các cột này có cùng kiểu dữ liệu.

pandas đã được nạp với bí danh pd, và engine cơ sở dữ liệu engine đã được tạo.

Lưu ý: Bộ kiểm tra SQL khá khắt khe về thứ tự bảng trong phép nối — nó yêu cầu các bảng cụ thể ở bên trái và bên phải.

Hướng dẫn

100 XP
  • Hoàn thiện truy vấn để nối weather với hpd311calls theo các cột date và created_date, tương ứng.
  • Truy vấn cơ sở dữ liệu và gán dataframe kết quả cho calls_with_weather.
  • In vài dòng đầu của calls_with_weather để xác nhận tất cả các cột đã được nối.