1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Phát hiện giá trị khuyết

Các bộ dữ liệu thường có các giá trị khuyết ẩn được điền bằng những mã như 'NA', '.' hoặc ký hiệu khác. Trong bài tập này, bạn sẽ làm việc với bộ dữ liệu college chứa nhiều thông tin về sinh viên đại học. Nhiệm vụ của bạn là nhận diện các giá trị khuyết bằng cách phân tích bộ dữ liệu.

Để làm điều này, bạn có thể dùng phương thức .info() của pandas và hàm sort() của numpy cùng với phương thức .unique() để phân biệt rõ giá trị giả đại diện cho dữ liệu khuyết.

Tệp college.csv đã được nạp sẵn. Các gói numpy và pandas cũng đã được import với tên lần lượt là np và pd.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Đọc phiên bản CSV của bộ dữ liệu vào một DataFrame của pandas.