1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu với PySpark

Connected

Bài tập

Join thông thường

Bạn được cung cấp hai DataFrame để gộp thành một DataFrame hữu ích. Nhiệm vụ đầu tiên của bạn là nối (join) hai DataFrame theo cách thông thường và xem kế hoạch thực thi.

Các DataFrame flights_df và airports_df đã sẵn sàng cho bạn sử dụng.

Hướng dẫn

100 XP
  • Tạo DataFrame mới normal_df bằng cách join flights_df với airports_df.
  • Xác định kiểu join được dùng trong kế hoạch truy vấn.