1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Khám phá Dữ liệu với R

Connected

Bài tập

Loại bỏ mức (levels)

Bảng chéo từ bài trước cho thấy có một số mức có tần suất rất thấp. Để đơn giản hóa việc phân tích, thường nên loại bỏ các mức như vậy.

Trong R, việc này cần hai bước: đầu tiên lọc bỏ mọi hàng có các mức có tần suất rất thấp, sau đó loại bỏ các mức này khỏi biến factor bằng droplevels(). Lý do là hàm droplevels() sẽ giữ các mức chỉ có 1 hoặc 2 quan sát; nó chỉ loại các mức không còn tồn tại trong tập dữ liệu.

Hướng dẫn

100 XP

Bảng chéo từ bài trước có sẵn trong workspace của bạn dưới tên tab.

  • Nạp gói dplyr.
  • In tab để tìm xem mức nào của align có tổng số mục ít nhất.
  • Dùng filter() để lọc bỏ tất cả các hàng của comics có mức đó, rồi loại bỏ mức không dùng bằng droplevels(). Lưu tập dữ liệu đã đơn giản hóa với tên comics_filtered.