1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Dự đoán CTR với Machine Learning trong Python

Connected

Bài tập

Kiểm tra giá trị thiếu

Xác định giá trị thiếu rất quan trọng cho phân tích. Với cùng một tập dữ liệu, bạn sẽ lấy tổng số giá trị thiếu bằng cách lặp qua cả hàng và cột trong tập dữ liệu. Khi phát hiện giá trị thiếu, cần có thêm phương pháp để xử lý, chẳng hạn dùng Imputer từ sklearn. Nếu không xử lý giá trị thiếu, sẽ khó xây dựng dự đoán CTR đúng cách.

Dữ liệu mẫu dạng DataFrame đã được nạp dưới tên df. pandas được nhập là pd cũng đã sẵn trong không gian làm việc của bạn.

Hướng dẫn

100 XP
  • In tóm tắt cơ bản về các cột bằng .info().
  • In các giá trị thiếu theo cột bằng .isnull() (đừng quên dấu ngoặc!).
  • In tổng số giá trị thiếu theo hàng bằng cách dùng axis = 1 và .sum().