1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to Data Engineering

Connected

cvičení

Od úlohy k dílčím úkolům

V tomto cvičení využiješ paralelní výpočty k aplikaci funkce take_mean_age(), která počítá průměrný věk sportovců v daném roce v datasetu olympijských událostí. DataFrame athlete_events je již načtený a obsahuje mimo jiné dva sloupce:

  • Year: rok, ve kterém se olympijská událost konala
  • Age: věk olympionika

Budeš používat API multiprocessor.Pool, které ti umožňuje rozdělit zátěž mezi více procesů. Funkce parallel_apply() je definovaná v ukázkovém kódu. Jako vstup přijímá aplikovanou funkci, použité seskupení a počet jader potřebných pro analýzu. Všimni si, že dekorátor @print_timing slouží k měření času každé operace.

Pokyny

100 XP
  • Doplň kód tak, aby se funkce take_mean_age nejprve spustila s 1 jádrem, poté se 2 a nakonec se 4 jádry.