1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Đặt các cột Boolean

Một số bộ dữ liệu có các cột phù hợp nhất khi mô hình hóa dưới dạng giá trị Boolean. Tuy nhiên, pandas thường tải chúng dưới dạng float theo mặc định, vì mặc định dùng Boolean có thể gây tác dụng phụ không mong muốn như biến các giá trị NA thành True.

fcc_survey_subset.xlsx có một cột ID dạng chuỗi và vài cột True/False thể hiện các yếu tố gây áp lực tài chính. Bạn sẽ đánh giá xem các cột không phải ID nào không có giá trị NA và do đó có thể đặt về kiểu Boolean, rồi hướng dẫn read_excel() tải chúng đúng kiểu bằng tham số dtype.

pandas đã được nạp với tên pd.

Hướng dẫn 1/2

undefined XP
    1
    2
  • Đếm số giá trị NA ở từng cột của survey_data bằng isna() và sum(). Ghi lại những cột ngoài ID.x, nếu có, có số NA bằng 0.