1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Kết hợp dữ liệu với pandas

Connected

Bài tập

Lưu ý với merge_ordered(), nhiều cột

Khi dùng merge_ordered() để gộp theo nhiều cột, thứ tự cột rất quan trọng khi bạn kết hợp với tính năng điền giá trị tiến (forward fill). Hàm sẽ sắp xếp dữ liệu để gộp theo thứ tự các cột được cung cấp. Trong bài tập này, bạn sẽ gộp dữ liệu GDP và dân số từ World Bank cho Australia và Sweden, đồng thời đảo ngược thứ tự các cột dùng để gộp. Tần suất của hai chuỗi khác nhau: GDP theo quý, dân số theo năm. Hãy dùng tính năng forward fill để điền dữ liệu bị thiếu. Tùy vào thứ tự cột, việc điền tiến có thể vô tình dùng dữ liệu không mong muốn để lấp các giá trị khuyết.

Các bảng gdp và pop đã được nạp sẵn.

Hướng dẫn 1/2

undefined XP
  • 1
    • Dùng merge_ordered() trên gdp và pop, gộp theo các cột date và country kèm tính năng fill, lưu vào ctry_date.
  • 2
    • Thực hiện phép gộp tương tự giữa gdp và pop, nhưng nối theo country và date (đảo ngược so với bước 1) với tính năng fill, lưu thành date_ctry.