1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. R dành cho người dùng SAS

Connected

Bài tập

Kiểm tra số đo kích thước

Cho đến lúc này bạn đã loại bỏ 2 trường hợp có chiều cao abalone 0mm do đo sai. Bạn cũng đã loại 4 trường hợp shuckedWeight lớn hơn wholeWeight, điều này phi logic, có lẽ do lỗi ghi chép. Bộ dữ liệu abaloneKeep được nạp cho bài này giờ chỉ còn 4177 - 2 - 4 = 4171 trường hợp.

Ngoài ra, mối quan hệ giữa các số đo kích thước cũng cần được xem xét. length của abalone (tính bằng mm) được định nghĩa là số đo vỏ dài nhất. Vì vậy, length luôn phải lớn hơn height hoặc diameter. Bây giờ, bạn sẽ kiểm tra điều kiện này bằng một biểu đồ phân tán với đường tham chiếu Y=X. Sau đó, bạn sẽ loại bỏ mọi trường hợp không thỏa điều kiện length này.

Bộ dữ liệu abaloneKeep, cùng các gói dplyr và ggplot2, đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Vẽ biểu đồ phân tán với length trên trục x và height trên trục y, rồi thêm đường tham chiếu Y=X với intercept = 0 và slope = 1.
  • Vẽ biểu đồ phân tán với length trên trục x và diameter trên trục y, rồi thêm đường tham chiếu Y=X với intercept = 0 và slope = 1.
  • Cập nhật abaloneKeep để giữ lại những mẫu có length lớn hơn cả height và diameter.