1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong R

Connected

Bài tập

Không thuộc tập giá trị

Giờ bạn đã luyện tập cách phát hiện các vấn đề về ràng buộc thành viên, hãy sửa các vấn đề này trên một tập dữ liệu mới. Xuyên suốt chương này, bạn sẽ làm việc với tập dữ liệu sfo_survey, chứa các câu trả lời khảo sát từ hành khách bay từ Sân bay Quốc tế San Francisco (SFO). Người tham gia được hỏi về mức độ sạch sẽ của sân bay, thời gian chờ, an toàn, và mức độ hài lòng tổng thể.

Có một vài trục trặc trong quá trình thu thập dữ liệu dẫn đến một số điểm thiếu nhất quán trong tập dữ liệu. Trong bài tập này, bạn sẽ làm việc với cột dest_size, cột này phân loại quy mô sân bay điểm đến mà hành khách bay tới. Một data frame tên là dest_sizes có sẵn, chứa tất cả các kích cỡ điểm đến hợp lệ. Nhiệm vụ của bạn là tìm các hàng có dest_size không hợp lệ và loại chúng khỏi data frame.

dplyr đã được nạp và sfo_survey cùng dest_sizes đã sẵn sàng.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Đếm số lần xuất hiện của mỗi dest_size trong sfo_survey.