1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu thiếu trong R

Connected

Bài tập

Hình ảnh hóa đầu tiên về dữ liệu thiếu

Không dễ để nắm được các giá trị thiếu nằm ở đâu trong dữ liệu, và đây chính là lúc trực quan hóa phát huy tác dụng.

Hàm vis_miss() tạo một biểu đồ tổng quan về mức độ thiếu trong dữ liệu. Hàm này cũng có tùy chọn gom cụm các hàng dựa trên tình trạng thiếu (cluster = TRUE), và tùy chọn sắp xếp các cột từ thiếu nhiều đến thiếu ít (sort_miss = TRUE).

Hướng dẫn

100 XP

Sử dụng bộ dữ liệu riskfactors từ naniar:

  • Dùng vis_miss() để trực quan hóa mức độ thiếu trong dữ liệu.
  • Dùng vis_miss() với cluster = TRUE để khám phá một số cụm thiếu dữ liệu.
  • Dùng vis_miss() và sắp xếp các giá trị thiếu với sort_miss để sắp xếp các cột theo mức độ thiếu.