1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Đặt giá trị NA tùy chỉnh

Một phần của việc khám phá và làm sạch dữ liệu là kiểm tra các giá trị thiếu (missing) hay NA và quyết định cách xử lý chúng. Việc này sẽ dễ hơn khi các giá trị thiếu được coi là một kiểu dữ liệu riêng, và có các hàm của pandas nhắm trực tiếp vào các giá trị NA đó. pandas tự động coi một số giá trị là thiếu, nhưng bạn có thể truyền thêm các chỉ báo NA thông qua đối số na_values. Ở đây, bạn sẽ làm điều đó để đảm bảo các mã ZIP không hợp lệ trong dữ liệu thuế Vermont được mã hóa là NA.

pandas đã được nhập với bí danh pd.

Hướng dẫn

100 XP
  • Tạo một từ điển null_values, chỉ định rằng các 0 trong cột zipcode sẽ được coi là giá trị NA.
  • Tải vt_tax_data_2016.csv, sử dụng đối số na_values và từ điển đó để đảm bảo các mã ZIP không hợp lệ được xử lý như giá trị thiếu.