1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

Bài tập

Lần đầu inner join

Bạn được giao nhiệm vụ tìm ra các loại nhiên liệu phổ biến nhất được dùng trong taxi ở Chicago. Để hoàn tất phân tích, bạn cần gộp hai bảng taxi_owners và taxi_veh với nhau theo cột vid. Sau đó, bạn có thể dùng bảng đã gộp cùng với phương thức .value_counts() để tìm fuel_type xuất hiện nhiều nhất.

Vì bạn sẽ dùng pandas xuyên suốt khóa học, gói này đã được nạp sẵn với bí danh pd trong mỗi bài tập. Các DataFrame taxi_owners và taxi_veh cũng đã được nạp sẵn cho bạn.

Hướng dẫn 1/3

undefined XP
  • 1
    • Gộp taxi_owners với taxi_veh theo cột vid, và lưu kết quả vào taxi_own_veh.
  • 2
    • Đặt hậu tố cho bảng trái và phải đối với các cột trùng nhau khi gộp lần lượt là _own và _veh.
  • 3
    • Chọn cột fuel_type từ taxi_own_veh và in value_counts() để tìm các fuel_type phổ biến nhất được sử dụng.