1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Điền giá trị thiếu bằng mean & median

Điền khuyết (imputation) là phương pháp phù hợp khi bạn phải xử lý lượng dữ liệu lớn. Những cách đơn giản nhất để điền giá trị thiếu gồm điền một hằng số, giá trị trung bình (mean) của biến, hoặc các tham số thống kê cơ bản khác như trung vị (median) và mode.

Trong bài tập này, bạn sẽ điền các giá trị thiếu bằng mean và median cho từng cột. DataFrame diabetes đã được nạp sẵn cho bạn. SimpleImputer() từ sklearn.impute cũng đã được import để bạn sử dụng.

Hướng dẫn 1/2

undefined XP
  • 1
    • Tạo một đối tượng SimpleImputer() để thực hiện điền khuyết bằng mean.
    • Điền khuyết cho bản sao của DataFrame.
  • 2
    • Tạo một đối tượng SimpleImputer() để thực hiện điền khuyết bằng median.
    • Điền khuyết cho bản sao của DataFrame.