1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế quy trình Machine Learning bằng Python

Connected

Bài tập

Không phải mọi metric đều đồng thuận

Ở bài trước, bạn đã thấy không phải mọi metric đều đồng thuận khi xác định láng giềng gần nhất. Vậy liệu chúng cũng có thể bất đồng khi phát hiện ngoại lệ (outlier) không? Bạn quyết định kiểm chứng điều này. Bạn dùng lại bộ dữ liệu như trước, nhưng lần này đưa vào một bộ phát hiện ngoại lệ dựa trên Local Outlier Factor. Module LocalOutlierFactor đã được cung cấp dưới tên lof, và dữ liệu có trong features.

Hướng dẫn

100 XP
  • Phát hiện ngoại lệ trong features dùng metric euclidean.
  • Phát hiện ngoại lệ trong features dùng metric hamming.
  • Phát hiện ngoại lệ trong features dùng metric jaccard.
  • Tìm xem cả ba metric có đồng thuận trên bất kỳ một ngoại lệ nào không.