1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn PySpark

Connected

Bài tập

Join các chuyến bay với sân bay điểm đến

Bạn vừa được tuyển dụng làm kỹ sư dữ liệu cho một công ty du lịch toàn cầu. Nhiệm vụ đầu tiên của bạn là giúp công ty cải thiện vận hành bằng cách phân tích dữ liệu chuyến bay. Trong không gian làm việc của bạn có hai bộ dữ liệu: một bộ chứa chi tiết về các chuyến bay (flights) và một bộ chứa thông tin về các sân bay điểm đến (airports), cả hai đều đã sẵn sàng trong workspace của bạn.

Mục tiêu của bạn? Kết hợp hai bộ dữ liệu này để tạo ra một tập dữ liệu mạnh, liên kết từng chuyến bay với sân bay điểm đến tương ứng.

Hướng dẫn

100 XP
  • Xem DataFrame airports. Xác định cột khóa nào cho phép bạn join airports vào bảng flights.
  • Join flights với DataFrame airports trên cột "dest". Lưu kết quả là flights_with_airports.
  • Xem lại flights_with_airports. Lưu ý thông tin mới đã được thêm vào.