1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Tái cấu trúc một dictionary

Giờ bạn muốn làm sạch dữ liệu về các chính trị gia và đưa nó vào một Dask DataFrame. Tuy nhiên, dữ liệu này đang ở dạng lồng nhau, nên bạn cần xử lý thêm trước khi đưa vào DataFrame.

Một mẩu dữ liệu cụ thể bạn cần trích xuất nằm sâu vài lớp bên trong dictionary. Đó là đường dẫn đến trang web của mỗi chính trị gia. Ví dụ dưới đây cho thấy cách nó được lưu trong dictionary.

record = {
...
 'links': [{'note': '...',
            'url': '...'},],  # Stored here
...
}

Bag chứa dữ liệu về các chính trị gia đã có sẵn trong môi trường của bạn với tên dict_bag.

Hướng dẫn

100 XP
  • Hoàn thiện hàm extract_url() để trích xuất khóa 'url' từ dictionary, khóa này nằm ở vị trí thứ 0 trong list dưới khóa 'links', và gán giá trị này cho khóa url.
  • Chạy hàm extract_url() trên tất cả phần tử trong bag.