1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giới thiệu về Anomaly Detection bằng R

Connected

Bài tập

Chuẩn hóa đặc trưng

Điều quan trọng là cần đảm bảo các đặc trưng đầu vào cho phép tính khoảng cách kNN được chuẩn hóa bằng hàm scale(). Việc chuẩn hóa giúp các đặc trưng có trung bình hoặc phương sai lớn không ảnh hưởng quá mức đến điểm khoảng cách kNN.

Hướng dẫn

100 XP
  • Dùng hàm summary() với dữ liệu wine để tính giá trị trung bình, nhỏ nhất và lớn nhất cho pH và alcohol.
  • Dùng hàm scale() để tạo phiên bản đã chuẩn hóa của dữ liệu wine có tên wine_scaled.
  • Dùng hàm summary() với wine_scaled để kiểm tra rằng các giá trị trung bình và khoảng giá trị đã thay đổi.