1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Tái định dạng dữ liệu với pandas

Connected

Bài tập

Movies lồng nhau

Bạn đang tò mò về một bộ dữ liệu movies mà bạn đã lưu trên máy tính một thời gian, chứa dữ liệu về nhiều bộ phim khác nhau. Bạn muốn phân tích dữ liệu đó, nhưng nhận ra nó đang ở định dạng JSON lồng nhau.

Để đọc nó vào một DataFrame, bạn sẽ cần dùng hàm vừa học. Sau đó, bạn sẽ biến đổi (reshape) DataFrame nhận được để dễ làm việc hơn.

Tệp JSON bán cấu trúc tên là movies đã sẵn sàng cho bạn. Hãy nhớ kiểm tra nó trong console!

Hướng dẫn

100 XP
  • Import hàm json_normalize() từ pandas.
  • Chuẩn hóa JSON nằm trong movies. Tách các tên được tạo ra từ các bản ghi lồng nhau bằng dấu gạch dưới.
  • Biến đổi (reshape) DataFrame movies_norm thu được từ dạng rộng sang dạng dài, sử dụng các cột director và producer làm chỉ số duy nhất. Đặt tên cho biến mới được tạo từ các cột movies, bắt đầu bằng features, được phân tách bằng dấu gạch dưới với hậu tố chứa các từ.