1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Làm sạch dữ liệu trong R

Connected

Bài tập

Trực quan hóa dữ liệu khuyết

Xử lý dữ liệu khuyết là một trong những tác vụ phổ biến nhất trong khoa học dữ liệu. Có nhiều kiểu thiếu dữ liệu khác nhau, và cũng có nhiều cách tiếp cận để xử lý chúng.

Bạn vừa nhận một phiên bản mới của data frame accounts chứa dữ liệu về số dư và số tiền đầu tư của khách hàng mới và hiện tại. Tuy nhiên, có những hàng bị thiếu giá trị inv_amount.

Bạn biết chắc rằng phần lớn khách hàng dưới 25 tuổi chưa có tài khoản đầu tư, và nghi ngờ điều này có thể là nguyên nhân gây ra dữ liệu khuyết. Các gói dplyr và visdat đã được nạp và accounts đã sẵn sàng.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Trực quan hóa các giá trị bị thiếu trong accounts theo từng cột bằng một hàm từ gói visdat.