1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Lập trình song song với Dask trong Python

Connected

Bài tập

Lọc Dask bag

Dữ liệu về các chính trị gia mà bạn đang làm việc đến từ nhiều nguồn khác nhau, nên không sạch lắm. Nhiều dictionary bị thiếu các khóa mà bạn có thể cần để phân tích. Bạn sẽ cần lọc bỏ các phần tử thiếu những khóa quan trọng.

Một hàm tên là has_birth_date() đã có sẵn trong môi trường. Hàm này kiểm tra dictionary đầu vào để xem nó có chứa khóa 'birth_date' hay không. Nó trả về True nếu có khóa đó trong dictionary và False nếu không có.

def has_birth_date(dictionary):
  return 'birth_date' in dictionary

Bag bạn đã tạo ở bài tập trước có sẵn trong môi trường với tên dict_bag.

Hướng dẫn

100 XP
  • Dùng phương thức .count() của dict_bag để in ra số phần tử nó chứa.
  • Dùng hàm has_birth_date() để lọc bỏ các phần tử không có khóa 'birth_date'.
  • In ra số phần tử mà filtered_bag chứa.