1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Phân tích tỷ lệ thiếu dữ liệu

Trước khi xử lý dữ liệu thiếu, điều quan trọng là phân tích các yếu tố xoay quanh hiện tượng thiếu dữ liệu. Bước cơ bản là phân tích mức độ thiếu, tức là số lượng giá trị bị thiếu của mỗi biến. Trong bài tập này, bạn sẽ tính tổng số giá trị bị thiếu theo từng cột và tính cả phần trăm giá trị bị thiếu theo cột.

Trong bài tập này, bạn sẽ nạp bộ dữ liệu 'airquality' bằng cách phân tích cột Date rồi tính tổng số giá trị bị thiếu và mức độ thiếu (tính theo phần trăm) trên DataFrame nullity

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Nạp 'air-quality.csv' vào một DataFrame pandas, đồng thời phân tích cột 'Date' và đặt cột này làm chỉ mục (index).