1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tiền xử lý cho Machine Learning bằng Python

Connected

Bài tập

Loại bỏ dữ liệu khuyết

Bây giờ bạn đã khám phá bộ dữ liệu volunteer và hiểu cấu trúc cũng như nội dung của nó, đã đến lúc bắt đầu loại bỏ các giá trị khuyết.

Trong bài tập này, bạn sẽ loại bỏ cả cột lẫn hàng để tạo một tập con của bộ dữ liệu volunteer.

Hướng dẫn

100 XP
  • Loại bỏ các cột Latitude và Longitude khỏi volunteer, lưu thành volunteer_cols.
  • Tạo tập con từ volunteer_cols bằng cách loại bỏ các hàng có giá trị khuyết trong category_desc, và lưu vào biến mới tên là volunteer_subset.
  • Xem thuộc tính .shape của volunteer_subset để kiểm tra đã thực hiện đúng.