1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý dữ liệu với pandas

Connected

Bài tập

Thay thế giá trị khuyết

Một cách khác để xử lý giá trị khuyết là thay tất cả chúng bằng cùng một giá trị. Với biến số, một lựa chọn là thay bằng 0 — bạn sẽ làm điều đó ở đây. Tuy nhiên, khi thay thế giá trị khuyết, bạn đang giả định về ý nghĩa của việc thiếu dữ liệu. Trong trường hợp này, bạn sẽ giả định rằng số lượng bán bị khuyết nghĩa là tuần đó không có doanh số cho loại bơ đó.

Trong bài tập này, bạn sẽ xem việc thay thế giá trị khuyết có thể ảnh hưởng đến phân phối của một biến như thế nào bằng cách dùng biểu đồ tần suất (histogram). Bạn có thể vẽ histogram cho nhiều biến cùng lúc như sau:

dogs[["height_cm", "weight_kg"]].hist()

pandas đã được import dưới tên pd và matplotlib.pyplot đã được import dưới tên plt. Bộ dữ liệu avocados_2016 đã sẵn có.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Một danh sách đã được tạo, cols_with_missing, chứa tên các cột có giá trị khuyết: "small_sold", "large_sold", và "xl_sold".
  • Tạo một histogram cho các cột đó.
  • Hiển thị biểu đồ.