1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Chuyển đổi sang DataFrame

Bạn muốn tạo một DataFrame từ dữ liệu JSON về chính trị gia. Sau khi đã bỏ lồng dữ liệu (de-nested), việc còn lại là chọn các khóa sẽ giữ lại làm cột trong DataFrame.

Dask bag bạn đã tạo ở bài trước có sẵn trong môi trường với tên dict_bag.

Hướng dẫn

100 XP
  • Hoàn thiện hàm select_keys() để các khóa trong danh sách keys_to_keep được thêm vào từ điển đã lọc mới và trả về nó.
  • Dùng hàm select_keys() để chọn các khóa ['gender','name', 'birth_date', 'url'] từ dict_bag.
  • Chuyển bag đã lọc sang Dask DataFrame.
  • In ra một vài dòng đầu của DataFrame.