1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Luyện tập câu hỏi phỏng vấn Machine Learning bằng Python

Connected

Bài tập

Truy tìm giá trị khuyết

Các câu hỏi về xử lý giá trị khuyết là phần không thể thiếu trong bất kỳ buổi phỏng vấn Machine Learning nào. Nếu bạn nhận được một tập dữ liệu có giá trị khuyết mà không xử lý, kết quả rất có thể sẽ bị lệch và làm giảm độ chính xác của mô hình.

Trong bài tập này, bạn sẽ thực hành bước tiền xử lý đầu tiên: tìm và khám phá cách xử lý giá trị khuyết bằng pandas và numpy trên một tập dữ liệu khoản vay khách hàng.

Tập dữ liệu này, mà bạn sẽ dùng cho nhiều bài tập trong khóa học, đã được lưu trong không gian làm việc của bạn dưới tên loan_data.

Đây là vị trí của bạn trong quy trình:

Machine learning pipeline

Hướng dẫn 1/4

undefined XP
  • 1
    • In ra các đặc trưng của loan_data kèm số lượng giá trị khuyết.
  • 2
    • Loại các hàng có giá trị khuyết và in phần trăm số hàng còn lại.
  • 3
    • Loại các cột có giá trị khuyết và in phần trăm số cột còn lại.
  • 4
    • Nội suy (impute) các giá trị khuyết của loan_data bằng 0 vào loan_data_filled
    • So sánh 'Credit Score' bằng .describe() trước khi nội suy với loan_data và sau khi nội suy với loan_data_filled.