1. Nauka
  2. /
  3. Kursy
  4. /
  5. Programowanie równoległe z Dask w Pythonie

Connected

ćwiczenie

Tworzenie Dask DataFrame z plików CSV

Wcześniej analizowałeś dane o utworach ze Spotify za pomocą pętli i funkcji opóźnionych. Teraz wiesz już, że te same zadania można wykonać prościej – używając Dask DataFrame. Przekonaj się, o ile łatwiej jest to zrobić tymi metodami zamiast pętlami. Na początek jednak musisz wczytać zbiór danych do Dask DataFrame.

Instrukcje

100 XP
  • Zaimportuj podmoduł dask.dataframe jako dd.
  • Wczytaj wszystkie pliki CSV z folderu data/spotify, ustawiając maksymalny rozmiar bloku na 1 MB.
  • Użyj funkcji dd.to_datetime(), aby przekonwertować ciągi tekstowe w kolumnie 'release_date' na wartości typu datetime.
  • Użyj metody .head() na DataFrame, aby wyświetlić 5 pierwszych wierszy tabeli.