1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Xử lý Dữ liệu Khuyết trong Python

Connected

Bài tập

Thay thế các giá trị khuyết bị ẩn

Trong hai bài tập trước, bạn đã xác định và xử lý giá trị khuyết khi nhập dữ liệu. Ở bài này, bạn sẽ nhận diện các giá trị khuyết bị ẩn trong dữ liệu và xử lý chúng. Bạn sẽ dùng bộ dữ liệu diabetes đã được nạp sẵn cho bạn.

DataFrame diabetes có các giá trị 0 ở cột BMI. Nhưng BMI không thể bằng 0. Thay vào đó, chúng nên là NaN. Trong bài này, bạn sẽ học cách phát hiện những điểm bất thường như vậy. Bạn sẽ thực hiện một vài phân tích dữ liệu đơn giản để bắt các giá trị khuyết và thay thế chúng. Cả numpy và pandas đã được nhập với bí danh lần lượt là np và pd.

Ngoài ra, bạn có thể thử tương tác với dữ liệu như in .head(), .info()… để làm quen hơn với bộ dữ liệu.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Mô tả các thống kê cơ bản của diabetes.