1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Nội suy bằng KNN

Các bộ dữ liệu luôn có những đặc trưng tương quan với nhau. Vì vậy, việc xem chúng như một yếu tố khi nội suy (impute) giá trị khuyết là rất quan trọng. Các mô hình Machine Learning sử dụng các đặc trưng trong DataFrame để tìm tương quan và mẫu hình nhằm dự đoán một đặc trưng được chọn.

Một trong những mô hình đơn giản và hiệu quả nhất là K Nearest Neighbors. Mô hình này tìm 'K' điểm giống nhất với các điểm dữ liệu hiện có để nội suy các giá trị bị thiếu.

Trong bài tập này, DataFrame diabetes đã được nạp sẵn cho bạn. Hãy dùng gói fancyimpute để nội suy các giá trị khuyết trong DataFrame diabetes.

Hướng dẫn

100 XP
  • Import KNN từ fancyimpute.
  • Sao chép diabetes thành diabetes_knn_imputed.
  • Tạo một đối tượng KNN() và gán cho knn_imputer.
  • Nội suy DataFrame diabetes_knn_imputed.