1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Bài tập

Chỉ định kiểu dữ liệu

Khi tải một flat file, pandas sẽ suy luận kiểu dữ liệu phù hợp nhất cho từng cột. Đôi khi dự đoán này không chính xác, đặc biệt với các con số dùng để biểu diễn nhóm hay thuộc tính thay vì đại lượng đo đếm.

Xem từ điển dữ liệu của vt_tax_data_2016.csv cho thấy có hai cột như vậy. Cột agi_stub chứa các số tương ứng với các nhóm thu nhập, và zipcode có các giá trị 5 chữ số lẽ ra phải là chuỗi — nếu xử lý chúng như số nguyên thì sẽ mất các số 0 ở đầu, vốn có ý nghĩa. Hãy chỉ định đúng kiểu dữ liệu bằng đối số dtype.

pandas đã được nhập sẵn với bí danh pd.

Hướng dẫn 1/2

undefined XP
    1
    2

Tải vt_tax_data_2016.csv không kèm đối số và xem thuộc tính dtypes của dataframe. Ghi nhận kiểu dữ liệu của zipcode và agi_stub.