1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Dask로 병렬 프로그래밍

Connected

연습 문제

Spotify의 노래 분석하기

Spotify 음악 카탈로그를 살펴보기 위해 집계하려는 CSV 파일 목록이 있습니다. 중요한 점은 이 작업을 빠르게 수행하고, 사용 가능한 모든 컴퓨팅 파워를 활용하고 싶다는 것입니다.

각 CSV 파일에는 특정 연도에 발매된 모든 노래가 포함되어 있고, 각 행에는 개별 노래에 대한 정보가 들어 있습니다.

dask와 delayed()는 이미 불러와 두었고, 파일 이름 목록은 환경의 filenames로 제공됩니다. pandas는 pd로 임포트되어 있습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • 각 파일을 DataFrame으로 불러오기 위해 pd.read_csv() 함수의 지연 버전을 사용하세요.