1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tái định dạng dữ liệu với pandas

Connected

Bài tập

Ít đồ ăn nhanh hơn, làm ơn!

Lại thứ Hai! Bạn sẽ bắt đầu một dự án mới — phân tích sự thay đổi của tình trạng béo phì qua các năm. Bạn có một bộ dữ liệu tên là obesity chứa tỷ lệ béo phì theo các quốc gia và các năm. Dữ liệu cũng được tách theo giới tính sinh học.

Mục tiêu chính của bạn là lấy tỷ lệ béo phì trung bình theo năm và giới, và theo quốc gia và giới. Ngoài ra, bạn cũng muốn tính chênh lệch giữa các năm.

Bạn nhận thấy bộ dữ liệu có nhiều chỉ mục (multi-index), nên bạn biết mình sẽ cần unstack các cấp để đạt được mục tiêu.

DataFrame obesity đã có sẵn trong phiên làm việc của bạn.

Hướng dẫn 1/3

undefined XP
  • 1

    Đổi dạng DataFrame obesity bằng cách unstack cấp đầu tiên, sau đó lấy giá trị trung bình của các cột.

  • 2

    Tạo một DataFrame obesity_mean bằng cách unstack cấp thứ hai của obesity và lấy giá trị trung bình cho các cột.

  • 3

    Cuối cùng, unstack cấp thứ ba của DataFrame obesity, rồi tính chênh lệch giữa các cột bằng .diff().