1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong R

Connected

Bài tập

Gộp các bản sao một phần

Một cách khác để xử lý các bản sao một phần là tính một thống kê tóm tắt cho các giá trị khác nhau giữa các bản sao này, chẳng hạn như trung bình, trung vị, giá trị lớn nhất hoặc nhỏ nhất. Cách làm này hữu ích khi bạn không chắc dữ liệu được thu thập như thế nào và muốn lấy giá trị trung bình; hoặc dựa trên hiểu biết miền, bạn muốn ước lượng hơi cao hơn thay vì quá thấp (hoặc ngược lại).

dplyr đã được nạp và bike_share_rides đã sẵn sàng.

Hướng dẫn

100 XP
  • Nhóm bike_share_rides theo ride_id và date.
  • Thêm một cột tên duration_min_avg chứa thời lượng chuyến đi trung bình cho ride_id và date của dòng đó.
  • Xóa các bản trùng lặp dựa trên ride_id và date, đồng thời giữ tất cả các cột của data frame.
  • Xóa cột duration_min.