1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. R dành cho người dùng SAS

Connected

Bài tập

Kiểm tra bộ dữ liệu cuối cùng

Đến thời điểm này, bạn đã thêm sáu biến mới vào bộ dữ liệu abalone gốc, tăng số cột từ 9 lên 15. Bạn cũng đã lọc bỏ (2+4+2) = 8 trường hợp do lỗi đo lường hoặc ghi dữ liệu, còn lại 4169 trường hợp.

Trong bài tập này, bạn sẽ xác nhận lại các con số trên bằng cách chạy dim() để kiểm tra kích thước của bộ dữ liệu abaloneKeep cuối cùng. Bạn cũng sẽ chạy một số kiểm tra trên bộ dữ liệu này: xem lại thống kê tóm tắt của tất cả biến và vẽ thêm vài biểu đồ phân tán để kiểm chứng các giả định về khối lượng và kích thước.

Bộ dữ liệu abaloneKeep cùng các gói dplyr và ggplot2 đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Lấy kích thước của bộ dữ liệu abaloneKeep cuối cùng.
  • Lấy thống kê tóm tắt của tất cả các biến trong abaloneKeep.
  • Vẽ biểu đồ phân tán với wholeWeight trên trục x và shuckedWeight trên trục y, thêm đường tham chiếu với intercept = 0 và slope = 1.
  • Vẽ biểu đồ phân tán với diameter trên trục x và length trên trục y, thêm đường tham chiếu với intercept = 0 và slope = 1.