1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do inżynierii danych

Connected

ćwiczenie

Od zadania do podzadań

W tym ćwiczeniu użyjesz przetwarzania równoległego, aby zastosować funkcję take_mean_age(), która oblicza średni wiek sportowca w danym roku na podstawie zbioru danych o wydarzeniach olimpijskich. Ramka danych athlete_events jest już wczytana i zawiera między innymi dwie kolumny:

  • Year: rok, w którym odbyło się wydarzenie olimpijskie
  • Age: wiek olimpijczyka

Skorzystasz z API multiprocessor.Pool, które umożliwia rozłożenie obciążenia na kilka procesów. Funkcja parallel_apply() jest zdefiniowana w przykładowym kodzie. Przyjmuje jako argumenty: stosowaną funkcję, sposób grupowania oraz liczbę rdzeni potrzebnych do analizy. Zwróć uwagę, że dekorator @print_timing służy do mierzenia czasu każdej operacji.

Instrukcje

100 XP
  • Uzupełnij kod tak, aby zastosować take_mean_age najpierw na 1 rdzeniu, następnie na 2 i na końcu na 4 rdzeniach.