1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Bài tập

Bù giá trị thiếu theo vòng lặp (Iterative imputation)

Ở bài trước, bạn đã tính bù trung bình cho các giá trị thiếu trong loan_data. Tuy nhiên, trong một buổi phỏng vấn về machine learning, bạn thường sẽ được hỏi về những kỹ thuật bù giá trị thiếu linh hoạt hơn, dựa trên các đặc trưng khác trong bộ dữ liệu.

Trong bài này, bạn sẽ thực hành một cách tiếp cận dựa trên machine learning bằng cách bù các giá trị thiếu như một hàm của các đặc trưng còn lại, sử dụng IterativeImputer() từ sklearn.impute. Đây là một bộ bù đa biến (multivariate imputer) ước lượng từng đặc trưng dựa trên tất cả các đặc trưng khác theo kiểu "vòng quay" (round-robin).

Lưu ý rằng hàm này hiện ở trạng thái thử nghiệm, vì vậy hãy đọc thêm trong tài liệu.

Bạn đang ở cùng vị trí trong Pipeline:

Machine learning pipeline

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Lọc các cột dạng số của loan_data và gán vào numeric_cols.