1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Hộp Công Cụ Python

Connected

Bài tập

Viết một iterator để tải dữ liệu theo từng phần (3)

Đến giờ bạn đã quen với việc đọc và xử lý dữ liệu theo từng phần. Hãy nâng thêm một bậc bằng cách thêm một cột vào DataFrame.

Bắt đầu từ mã của bài trước, bạn sẽ dùng một list comprehension để tạo giá trị cho cột mới 'Total Urban Population' từ danh sách các bộ giá trị (tuple) mà bạn đã tạo trước đó. Nhớ rằng trong bài trước, phần tử thứ nhất và thứ hai của mỗi tuple lần lượt là giá trị từ các cột 'Total Population' và 'Urban population (% of total)'. Vì vậy, các giá trị trong cột mới 'Total Urban Population' sẽ là tích của phần tử thứ nhất và phần tử thứ hai trong mỗi tuple. Hơn nữa, vì phần tử thứ hai là phần trăm, bạn cần chia toàn bộ kết quả cho 100, hoặc nhân với 0.01.

Bạn cũng sẽ vẽ dữ liệu từ cột mới này để trực quan hóa dữ liệu dân số đô thị.

Các gói pandas và matplotlib.pyplot đã được nhập lần lượt là pd và plt để bạn sử dụng.

Hướng dẫn

100 XP
  • Viết một list comprehension để tạo danh sách giá trị từ pops_list cho cột mới 'Total Urban Population'. Biểu thức đầu ra phải là tích của phần tử thứ nhất và phần tử thứ hai trong mỗi tuple của pops_list. Vì phần tử thứ hai là phần trăm, bạn cần nhân kết quả với 0.01 hoặc chia cho 100. Ngoài ra, lưu ý rằng cột 'Total Urban Population' chỉ nên nhận giá trị kiểu số nguyên. Để đảm bảo điều này, hãy ép kiểu biểu thức đầu ra sang số nguyên bằng int().
  • Tạo biểu đồ scatter trong đó trục x là các giá trị từ cột 'Year' và trục y là các giá trị từ cột 'Total Urban Population'.