1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Feature Engineering cho Machine Learning bằng Python

Connected

Bài tập

Dữ liệu của tôi thưa thớt đến mức nào?

Hầu hết các tập dữ liệu đều có giá trị khuyết, thường được biểu diễn là NaN (Not a Number). Nếu bạn làm việc với Pandas, bạn có thể dễ dàng kiểm tra có bao nhiêu giá trị khuyết trong mỗi cột.

Hãy tìm xem có bao nhiêu người tham gia khảo sát đã nhập tuổi của mình (trong cột Age của so_survey_df) và giới tính (cột Gender của so_survey_df).

Hướng dẫn 1/2

undefined XP
    1
    2
  • Lọc DataFrame chỉ giữ các cột 'Age' và 'Gender'.
  • In số lượng giá trị không khuyết ở cả hai cột.