1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. ETL và ELT với Python

Connected

Bài tập

Điền giá trị khuyết với pandas

Khi xây dựng pipeline dữ liệu, việc gặp dữ liệu khuyết là điều khó tránh. Đôi khi, bạn có thể muốn loại bỏ các bản ghi này khỏi tập dữ liệu. Nhưng ở những trường hợp khác, bạn sẽ cần nội suy (impute) các giá trị cho phần thông tin bị thiếu. Trong bài tập này, bạn sẽ luyện dùng pandas để nội suy điểm kiểm tra bị thiếu.

Dữ liệu từ tệp "testing_scores.json" đã được đọc vào một DataFrame và lưu trong biến raw_testing_scores. Ngoài ra, pandas đã được nạp với bí danh pd.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • In phần đầu của DataFrame raw_testing_scores, và quan sát các giá trị NaN.