1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tái định dạng dữ liệu với pandas

Connected

Bài tập

Đến giờ đọc sách rồi, Katniss!

Sắp hết giờ làm việc trong ngày rồi. Nhưng trước đó, bạn muốn làm một phân tích cho vui. Bạn sẽ phân tích một bộ dữ liệu sách khác, lần này là với series Hunger Games.

Bạn đã xem qua bộ dữ liệu books_hunger trước khi chuyển định dạng, nhưng có gì đó không ổn. Chỉ mục (index) của DataFrame đang chứa tiêu đề sách. Bạn biết rằng bạn không thể chuyển định dạng khi dữ liệu ở dạng này. Nếu làm vậy, bạn sẽ mất dữ liệu quan trọng là tiêu đề, nên bạn cần chỉnh sửa trước khi biến đổi DataFrame.

Bộ dữ liệu books_hunger đã có sẵn cho bạn. Nó chứa title, và dữ liệu về language, publication date, publication number, và page number của mỗi cuốn sách.

Hướng dẫn

100 XP
  • Chỉnh sửa DataFrame books_hunger bằng cách đặt lại chỉ mục (reset index) mà không xóa nó.
  • Chuyển books_hunger từ định dạng rộng (wide) sang dài (long). Dùng các cột title và language làm chỉ mục duy nhất. Đặt tên feature cho biến mới được tạo ra từ các cột bắt đầu bằng publication và page. Các cột đó được phân tách bằng một khoảng trắng và kết thúc bằng một từ.