1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Bài tập

Bù khuyết đơn giản (Simple imputation)

Như bạn đã thấy ở bài trước, xóa dữ liệu có thể làm giảm kích thước tập dữ liệu quá nhiều. Trong bối cảnh phỏng vấn, điều này có thể dẫn đến kết quả lệch cho mô hình Machine Learning của bạn.

Một cách linh hoạt hơn để xử lý giá trị thiếu là bù khuyết (impute). Có nhiều cách thực hiện điều này trong Python, nhưng trong bài này bạn sẽ dùng hàm SimpleImputer() từ mô-đun sklearn.impute trên loan_data.

Sau đó, bạn sẽ dùng pandas và numpy để chuyển tập dữ liệu đã bù khuyết thành một DataFrame.

Lưu ý rằng hiện có thêm 2 bước trong pipeline, Instantiate và Fit: Machine learning pipeline

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Lọc các cột số của loan_data và gán vào numeric_cols.