1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong R

Connected

Bài tập

Xóa bản ghi trùng lặp một phần

Bây giờ bạn đã xác định và xóa các bản trùng lặp hoàn toàn, đã đến lúc kiểm tra các bản trùng lặp một phần. Trùng lặp một phần khó xử lý hơn một chút so với trùng lặp hoàn toàn. Trong bài tập này, trước tiên bạn sẽ xác định các bản trùng lặp một phần, sau đó thực hành kỹ thuật phổ biến nhất để xử lý chúng: xóa tất cả các bản trùng lặp một phần và chỉ giữ lại bản đầu tiên.

dplyr đã được nạp và bike_share_rides đã sẵn sàng.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Đếm số lần xuất hiện của từng ride_id.
  • Lọc các ride_id xuất hiện nhiều lần.