1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu khám phá trong Python

Connected

Bài tập

Xử lý dữ liệu bị khuyết

Điều quan trọng là phải xử lý dữ liệu bị khuyết trước khi bắt đầu phân tích.

Một cách tiếp cận là loại bỏ các giá trị khuyết nếu chúng chỉ chiếm một tỷ lệ nhỏ, thường là 5%, trong dữ liệu của bạn.

Với bộ dữ liệu về giá vé máy bay, được lưu dưới dạng pandas DataFrame tên là planes, bạn sẽ cần đếm số lượng giá trị khuyết trên tất cả các cột, tính 5% tổng số giá trị, dùng ngưỡng này để loại bỏ các quan sát, và kiểm tra còn bao nhiêu giá trị khuyết trong bộ dữ liệu.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • In ra số lượng giá trị khuyết ở mỗi cột của DataFrame.