1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Trực quan hóa các phép bù dữ liệu

Phân tích các phép bù dữ liệu và chọn ra cách tốt nhất là một nhiệm vụ đòi hỏi nhiều thử nghiệm. Điều quan trọng là phải đảm bảo dữ liệu của bạn không bị lệch trong quá trình bù. Trong hai bài tập vừa rồi, bạn đã tạo 4 cách bù khác nhau: dùng trung bình, trung vị, mode và điền hằng số.

Trong bài này, bạn sẽ tạo biểu đồ scatter cho các DataFrame mà bạn đã bù trước đó. Để làm được điều này, bạn sẽ tạo một từ điển các DataFrame với khóa là tiêu đề của chúng.

Các DataFrame diabetes_mean, diabetes_median, diabetes_mode và diabetes_constant đã được nạp sẵn cho bạn.

Hướng dẫn

100 XP
  • Tạo 4 biểu đồ con bằng cách vẽ một hình có 2 hàng và 2 cột.
  • Tạo từ điển imputations bằng cách ánh xạ mỗi khóa với DataFrame tương ứng.
  • Lặp qua axes và imputations, và vẽ mỗi DataFrame trong imputations.
  • Đặt màu cho nullity và đặt tiêu đề cho mỗi biểu đồ con theo tên của phép bù.