1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Dask로 병렬 프로그래밍

Connected

연습 문제

요즘 노래는 얼마나 춤추기 좋을까요?

이제 Spotify 데이터를 더 깊이 살펴보며 음악 트렌드를 분석해 보겠습니다.

각 CSV 파일의 'danceability' 열에는 각 노래가 얼마나 춤추기 좋은지 0부터 1 사이 점수로 담겨 있습니다. 이 점수는 템포, 리듬 안정성, 비트 강도, 전체적인 규칙성 등 다양한 음악적 요소를 조합해 트랙이 춤에 얼마나 적합한지를 나타냅니다. 요즘 노래들은 예전보다 춤추기 더 좋아졌을까요, 아니면 덜 좋아졌을까요?

dask와 delayed() 함수는 이미 임포트되어 있어요. pandas는 pd로, matplotlib.pyplot은 plt로 임포트되어 있습니다. 파일 이름 목록은 환경의 filenames에, 각 파일의 연도는 years 리스트에 저장되어 있어요.

지침

100 XP
  • 반복문 안에서 각 파일을 지연 로딩하세요.
  • 'danceability' 열을 사용해 각 파일의 노래에 대한 평균 danceability를 구하세요.
  • danceabilities 리스트에 담긴 모든 결과를 계산한 뒤, 반환된 튜플의 첫 번째 항목을 선택하세요.
  • plt.plot()을 사용해 x축에 years, y축에 danceability_list를 놓고 그래프를 그리세요.