1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Tìm điểm láng giềng

Rõ ràng thuật toán hệ số ngoại lai cục bộ (local outlier factor) phụ thuộc nhiều vào khái niệm láng giềng gần nhất, mà khái niệm này lại phụ thuộc vào lựa chọn độ đo khoảng cách. Vì vậy, bạn quyết định thử nghiệm thêm với bộ dữ liệu hepatitis đã giới thiệu ở bài trước. Bạn được cung cấp ba mẫu lưu trong features, với nhãn tương ứng lưu trong labels. Bạn sẽ xác định láng giềng gần nhất của mẫu đầu tiên (hàng có chỉ số 0) bằng ba độ đo khoảng cách: Euclid, Hamming và Chebyshev, và dựa vào đó chọn độ đo khoảng cách nên dùng. Bạn sẽ nhập mô-đun cần thiết trong phần bài tập, còn pandas và numpy đã sẵn sàng, cũng như features và nhãn của chúng labels.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Import mô-đun DistanceMetric với bí danh dm.