1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Giới thiệu về Anomaly Detection bằng R

Connected

Bài tập

Khám phá dữ liệu nitrate của sông

Trong bài tập này, bạn sẽ khám phá bộ dữ liệu river, được sử dụng xuyên suốt chương để minh họa các kỹ thuật phát hiện bất thường phổ biến. Dữ liệu river là một data.frame gồm ba cột sau:

  • index - số nguyên mô tả thứ tự của các quan sát nitrate
  • nitrate - nồng độ nitrate hòa tan hằng tháng được tìm thấy trong một con sông
  • month - một biến phân loại (factor) chứa tháng tương ứng với mỗi quan sát nitrate

Bạn sẽ khám phá cột nitrate bằng thống kê tóm tắt và biểu đồ hộp (boxplot) để đánh giá liệu có thể tồn tại các điểm bất thường (point anomalies) hay không.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • In ra vài dòng đầu tiên của dữ liệu river để hình dung nội dung của bộ dữ liệu.