1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nền tảng Big Data với PySpark

Connected

Bài tập

Nạp dữ liệu trong PySpark shell

Trong PySpark, bạn biểu diễn phép tính của mình thông qua các thao tác trên các tập hợp phân tán, tự động được song song hóa trên cụm. Ở bài trước, bạn đã thấy ví dụ nạp một danh sách thành tập hợp song song; trong bài này, bạn sẽ nạp dữ liệu từ một tệp cục bộ trong PySpark shell.

Lưu ý: bạn đã có sẵn SparkContext sc và biến file_path (đường dẫn tới tệp README.md) trong không gian làm việc.

Hướng dẫn

100 XP
  • Nạp tệp văn bản cục bộ README.md trong PySpark shell.