1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tái định dạng dữ liệu với pandas

Connected

Bài tập

Rất đơn giản, Watson thân mến!

Hôm nay là thứ Sáu và bạn sắp hoàn thành dự án về sách của mình. Nhiệm vụ cuối cùng là phân tích dữ liệu về các cuốn sách của Arthur Conan Doyle.

Bạn nhận ra bộ dữ liệu books_sh cần được chuyển định dạng. Bạn để ý có những cột có thể nhóm lại bằng tiền tố. Bạn xác định các cột sẽ dùng làm ID duy nhất. Tuy nhiên, một số cột trong đó chứa chuỗi ký tự và cần xử lý trước khi áp dụng phép chuyển từ dạng rộng sang dạng dài. Bạn quyết định tách một số chuỗi để DataFrame gọn gàng hơn.

Bộ dữ liệu books_sh đã sẵn sàng cho bạn. Nó chứa title và dữ liệu về version, number_pages, và number_ratings của mỗi cuốn sách.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Tách cột main_title thành hai cột title và subtitle. Dùng dấu hai chấm làm ký tự phân tách.