1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Spark SQL bằng Python

Connected

Bài tập

Luyện đọc query plan 2

Có ba dataframe: part2_df, part3_df, và part4_df. Bạn có thể trả lời các câu hỏi trong bài này bằng cách xem đầu ra của explain() cho từng dataframe.

Lưu ý Spark gắn thêm mô tả vào mỗi tên cột, phân tách bằng ký hiệu #. Ví dụ: word#0, id#1L, part#2, và title#3. Với bài tập này, bạn có thể bỏ qua các mô tả đó.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4

Câu hỏi

  • part2_df được nạp từ file nào? Không cần đường dẫn đầy đủ, chỉ cần tên file và phần mở rộng.

Các phương án trả lời