1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Học có giám sát trong R: Phân loại

Connected

Bài tập

Khám phá bộ dữ liệu biển báo giao thông

Để hiểu rõ hơn cách hàm knn() có thể phân loại biển "dừng lại" (stop), bạn nên xem qua bộ dữ liệu huấn luyện mà hàm đã dùng.

Mỗi biển báo đã quan sát trước đó được chia thành một lưới 4x4, và mức độ đỏ, xanh lục, xanh lam của 16 điểm ảnh ở giữa được ghi lại như minh họa dưới đây.

Stop Sign Data Encoding

Kết quả là một bộ dữ liệu ghi lại sign_type cũng như 16 x 3 = 48 thuộc tính màu của mỗi biển báo.

Hướng dẫn

100 XP
  • Dùng hàm str() để xem xét bộ dữ liệu signs.
  • Dùng table() để đếm số lượng quan sát của mỗi loại biển bằng cách truyền cho hàm cột chứa nhãn.
  • Chạy lệnh aggregate() đã cho để xem mức độ đỏ trung bình có thay đổi theo loại biển hay không.