1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích hoạt động của cảnh sát với pandas

Connected

Bài tập

Loại bỏ hàng

Khi bạn biết một cột cụ thể sẽ rất quan trọng cho phân tích, và chỉ một phần nhỏ các hàng bị thiếu giá trị ở cột đó, thì thường hợp lý khi loại bỏ những hàng này khỏi tập dữ liệu.

Trong khóa học này, cột driver_gender sẽ là trọng tâm của nhiều phân tích. Vì chỉ một phần nhỏ các hàng bị thiếu driver_gender, chúng ta sẽ loại bỏ các hàng đó khỏi tập dữ liệu.

Hướng dẫn

100 XP
  • Đếm số giá trị bị thiếu trong từng cột.
  • Loại bỏ tất cả các hàng thiếu driver_gender bằng cách truyền tên cột vào tham số subset của .dropna().
  • Đếm lại số giá trị bị thiếu trong từng cột để xác nhận rằng không còn hàng nào thiếu driver_gender.
  • Xem .shape của DataFrame để biết còn bao nhiêu hàng và cột.