Xử lý dữ liệu theo lô (1)

Đôi khi, nguồn dữ liệu có thể lớn đến mức việc lưu toàn bộ tập dữ liệu trong bộ nhớ trở nên quá tốn tài nguyên. Trong bài tập này, bạn sẽ xử lý 1000 dòng đầu tiên của một tệp theo từng dòng, để tạo một từ điển đếm số lần mỗi quốc gia xuất hiện trong một cột của tập dữ liệu.

Tệp csv 'world_dev_ind.csv' đang có sẵn trong thư mục hiện tại để bạn sử dụng. Để bắt đầu, bạn cần mở kết nối tới tệp này bằng trình quản lý ngữ cảnh (context manager). Ví dụ, lệnh with open('datacamp.csv') as datacamp sẽ liên kết tệp csv 'datacamp.csv' với tên datacamp trong trình quản lý ngữ cảnh. Ở đây, câu lệnh with là trình quản lý ngữ cảnh, và mục đích của nó là đảm bảo cấp phát tài nguyên hiệu quả khi mở kết nối tới một tệp.

Nếu bạn muốn tìm hiểu thêm về trình quản lý ngữ cảnh, hãy xem khóa học Importing Data in Python trên DataCamp.

Dùng open() để liên kết tệp csv 'world_dev_ind.csv' với tên file trong trình quản lý ngữ cảnh.
Hoàn thiện vòng lặp for để nó lặp 1000 lần nhằm thực thi thân vòng lặp và chỉ xử lý 1000 dòng dữ liệu đầu tiên của tệp.

Bài tập

Xử lý dữ liệu theo lô (1)

Hướng dẫn

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Bài tập

Hướng dẫn

Bài tập