1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Analiza utworów na Spotify

Masz listę plików CSV, które chcesz zagregować, aby zbadać katalog muzyczny Spotify. Zależy ci na szybkim przetwarzaniu danych z wykorzystaniem całej dostępnej mocy obliczeniowej.

Każdy plik CSV zawiera wszystkie utwory wydane w danym roku, a każdy wiersz opisuje jeden utwór.

dask i delayed() zostały już zaimportowane, a lista nazw plików jest dostępna w twoim środowisku jako filenames. pandas zostało zaimportowane jako pd.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Użyj opóźnionej wersji funkcji pd.read_csv(), aby wczytać każdy z plików jako DataFrame.