1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Nạp dữ liệu gọn nhẹ với pandas

Connected

Exercises

Nhập tệp theo từng phần (chunk)

Khi làm việc với các tệp lớn, việc tải và xử lý dữ liệu theo từng phần có thể dễ dàng hơn. Hãy thực hành quy trình này với dữ liệu thuế của Vermont.

500 dòng đầu tiên đã được tải vào vt_data_first500. Bạn sẽ lấy 500 dòng tiếp theo. Để làm điều này, bạn sẽ dùng một số tham số: nrows và skiprows để lấy đúng bản ghi, header để báo cho pandas rằng dữ liệu không có tên cột, và names để cung cấp các tên cột còn thiếu. Bạn cũng sẽ dùng hàm list() để lấy danh sách tên cột từ vt_data_first500 để tái sử dụng.

pandas đã được nhập với bí danh pd.

คำแนะนำ

100 XP
  • Dùng nrows và skiprows để tạo một dataframe, vt_data_next500, gồm 500 dòng tiếp theo.
  • Thiết lập đối số header để pandas biết là không có hàng tiêu đề.
  • Đặt tên các cột cho vt_data_next500 bằng cách cung cấp danh sách các cột của vt_data_first500 cho đối số names.