1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Łączenie operacji

Gdy dane są już wczytane i oczyszczone, możesz przystąpić do ich analizy. Pierwsze zadanie polega na zbadaniu dat urodzenia polityków. Daty są zapisane w formacie tekstowym, np. 'YYYY-MM-DD'. Pierwsze 4 znaki łańcucha to rok.

Filtrowany worek Dask utworzony w poprzednim ćwiczeniu, filtered_bag, jest dostępny w twoim środowisku.

Instrukcje

100 XP
  • Użyj metody .pluck() worka, aby wyodrębnić łańcuchy 'birth_date'.
  • Napisz funkcję lambda, która wyodrębni rok z łańcuchów 'birth_date' i przekształci go na liczbę całkowitą.
  • Użyj nowego worka birth_year_bag, aby obliczyć minimalny, maksymalny i średni rok urodzenia.
  • Użyj funkcji dask.compute(), aby efektywnie obliczyć wszystkie trzy agregacje.