1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Xóa MCAR

Phân tích và xử lý hợp lý các giá trị thiếu là một việc không đơn giản. Tuy nhiên, nếu số lượng giá trị thiếu rất nhỏ, thì việc xử lý lại khá dễ. Trong bài tập video, bạn đã học cách nhận diện đúng, khi nào nên loại bỏ và cách xóa dữ liệu bị thiếu.

Trong bài tập này, bạn sẽ xóa toàn bộ các hàng (listwise deletion) nơi cột Glucose có giá trị thiếu. DataFrame diabetes và gói missingno với bí danh msno đã được nạp sẵn cho bạn.

Lưu ý: chúng tôi dùng hàm độc quyền display() thay cho plt.show() để bạn xem đầu ra thuận tiện hơn.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Trực quan hóa ma trận thiếu dữ liệu của diabetes.