1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Đoán loại thiếu dữ liệu

Phân tích loại thiếu dữ liệu giúp bạn suy ra cách tốt nhất để xử lý dữ liệu khuyết. Bộ dữ liệu tiểu đường Pima Indians rất nổi tiếng vì có dữ liệu bị thiếu. Pima Indians là một nhóm sắc tộc có nguy cơ mắc bệnh tiểu đường cao hơn. Bộ dữ liệu này chứa nhiều xét nghiệm trong phòng thí nghiệm được thực hiện với các thành viên trong cộng đồng này.

Trong video bài học, bạn đã học 3 kiểu mô hình thiếu dữ liệu. Trong bài tập này, trước tiên bạn sẽ trực quan hóa bản tóm tắt thiếu dữ liệu rồi xác định các loại thiếu dữ liệu có trong DataFrame.

DataFrame đã được nạp sẵn cho bạn dưới tên diabetes.

Lưu ý: chúng tôi dùng hàm độc quyền display() thay cho plt.show() để bạn dễ xem phần đầu ra hơn.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Import gói missingno với bí danh msno và vẽ bản tóm tắt thiếu dữ liệu của diabetes.