1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Big Data với PySpark

Connected

Bài tập

Khám phá dữ liệu trong PySpark DataFrame

Khám phá dữ liệu là bước rất quan trọng trước khi thực hiện các phân tích như vẽ biểu đồ, mô hình hóa, huấn luyện, v.v. Trong bài tập đơn giản này, bạn sẽ xem xét dữ liệu trong DataFrame people_df mà bạn đã tạo ở bài trước bằng các toán tử cơ bản của DataFrame.

Lưu ý, bạn đã có sẵn SparkSession spark và DataFrame people_df trong không gian làm việc của mình.

Hướng dẫn

100 XP
  • In 10 quan sát đầu tiên trong DataFrame people_df.
  • Đếm số hàng trong DataFrame people_df.
  • DataFrame people_df có bao nhiêu cột và tên của chúng là gì?