1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Machine Learning End-to-End

Connected

Bài tập

Làm sạch dữ liệu của bạn

Các tập dữ liệu ngoài đời thực như dữ liệu bệnh tim thường khá lộn xộn, chứa giá trị trùng lặp hoặc bị thiếu. Trong bài tập này, bạn sẽ áp dụng các kỹ năng đã học trong chương để làm sạch dữ liệu bệnh tim. Tập dữ liệu đã được nạp sẵn cho bạn. Nhiệm vụ của bạn là xác định và thực hiện các thao tác làm sạch tổng quát dựa trên kết quả EDA: xóa các cột rỗng, loại bỏ các hàng trùng lặp và nội suy (imputation) cho cột restecg, liên quan đến phép đo điện tâm đồ. Pandas đã được nhập với tên pd, và tập dữ liệu bệnh tim được lưu dưới dạng pandas DataFrame tên là heart_disease_df.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Xóa cột "oldpeak" đang rỗng.