1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

Bài tập

Tổng số lượt đi trong một tháng

Mục tiêu của bạn là tìm tổng số lượt đi được cung cấp cho hành khách đi qua ga Wilson (station_name == 'Wilson') khi sử dụng hệ thống giao thông công cộng của Chicago vào các ngày trong tuần (day_type == 'Weekday') trong tháng 7 (month == 7). May mắn là Chicago cung cấp dữ liệu chi tiết này, nhưng dữ liệu nằm ở ba bảng khác nhau. Bạn sẽ thực hiện gộp (merge) các bảng này lại với nhau để trả lời câu hỏi. Đây là dữ liệu khác với dữ liệu kinh doanh bạn đã thấy trước đó, nhưng tất cả thông tin cần thiết để trả lời câu hỏi đều đã được cung cấp.

Các DataFrame cal, ridership và stations đã được nạp sẵn cho bạn. Mối quan hệ giữa các bảng được thể hiện trong sơ đồ dưới đây.

Sơ đồ bảng. Bảng cal liên hệ với ridership qua year, month và day. Bảng ridership liên hệ với bảng stations qua station_id.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Gộp hai bảng ridership và cal, bắt đầu với bảng ridership ở bên trái và lưu kết quả vào biến ridership_cal. Nếu mã của bạn chạy quá lâu, có thể điều kiện gộp của bạn chưa đúng.