1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn PySpark

Connected

Bài tập

Xử lý dữ liệu thiếu với fill và drop

Ôi trời… Bộ dữ liệu này có rất nhiều giá trị thiếu! Hãy làm sạch nó nhé! Với tệp CSV đã nạp, hãy loại bỏ các hàng có bất kỳ giá trị null nào và hiển thị kết quả!

Nhớ rằng trong không gian làm việc của bạn đã có SparkSession tên là spark!

Hướng dẫn

100 XP
  • Loại bỏ mọi hàng có giá trị null trong DataFrame census_df.
  • Hiển thị DataFrame kết quả.