1. 학습
  2. /
  3. 강의
  4. /
  5. R dành cho người dùng SAS

Connected

연습 문제

Kiểm tra biến

Bây giờ khi chúng ta đã thêm một số biến mới vào abaloneMod, loạt bài tập tiếp theo sẽ khám phá chất lượng dữ liệu bằng thống kê tóm tắt và trực quan hóa đồ họa.

Bạn cũng sẽ filter() các trường hợp (các hàng trong dữ liệu abaloneMod) có lỗi hoặc giá trị phi logic bằng hàm dplyr::filter(). Ví dụ, có một vài con abalone có height bằng 0 mm, đây là sai do có thể gõ nhầm hoặc lỗi đo lường.

Bộ dữ liệu abaloneMod đã được nạp sẵn cho bạn cùng với các gói dplyr và ggplot2. Sau khi lọc các trường hợp, bạn sẽ tạo một bản sao đã chỉnh sửa mới của bộ dữ liệu tên là abaloneKeep, bộ này sẽ giữ lại các trường hợp cuối cùng để phân tích trong các bài học sau.

지침

100 XP
  • Lấy thống kê tóm tắt cho chiều cao (height) của abalone.
  • Giữ các trường hợp có height lớn hơn 0 và gán các trường hợp này vào dataframe mới abaloneKeep.
  • Với các abalone được giữ trong abaloneKeep, vẽ biểu đồ histogram của height, tất cả giờ đây đều phải lớn hơn 0.