1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Bổ sung bằng mode và hằng số

Điền giá trị khuyết bằng trung bình, trung vị, hằng số và mode rất phù hợp khi bạn chỉ có một lượng nhỏ giá trị thiếu. Ở bài trước, bạn đã nội suy bằng phương pháp trung bình và trung vị. Trong bài này, bạn sẽ điền các giá trị xuất hiện thường xuyên nhất trong cột, và thực hiện thêm một cách nội suy khác bằng cách điền một giá trị hằng số.

Như trước đó, DataFrame diabetes và hàm SimpleImputer() đã được nạp sẵn cho bạn.

Hướng dẫn 1/2

undefined XP
  • 1
    • Tạo một đối tượng SimpleImputer() để thực hiện nội suy theo mode (giá trị xuất hiện thường xuyên nhất).
    • Nội suy DataFrame đã sao chép.
  • 2
    • Tạo một đối tượng SimpleImputer() để điền các giá trị thiếu bằng 0.
    • Nội suy DataFrame đã sao chép.