1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Suy luận MNAR

Trong bài trước, bạn đã xác định loại giá trị khuyết dựa trên bản tóm tắt thiếu dữ liệu. Ở bài này, bạn sẽ tiếp tục để khẳng định dữ liệu Missing Not at Random (MNAR) — tức là thiếu không ngẫu nhiên.

Bản tóm tắt thiếu dữ liệu cho DataFrame diabetes như sau.

Mục tiêu của bạn là sắp xếp DataFrame diabetes theo Serum_Insulin và xác định mối tương quan giữa Skin_Fold và Serum_Insulin.

Lưu ý: chúng tôi dùng hàm độc quyền display() thay cho plt.show() để bạn dễ xem kết quả hơn.

Hướng dẫn

100 XP
  • Import gói missingno với bí danh msno.
  • Sắp xếp các giá trị của cột Serum_Insulin trong diabetes.
  • Trực quan hóa tóm tắt thiếu dữ liệu của Serum_Insulin bằng msno.matrix().