1. 학습
  2. /
  3. 강의
  4. /
  5. Python에서 Dask로 병렬 프로그래밍

Connected

연습 문제

CSV에서 Dask DataFrame 만들기

이전에 루프와 지연 함수(delayed functions)를 사용해 Spotify 노래 데이터를 분석했어요. 이제는 Dask DataFrame을 사용하면 같은 작업을 훨씬 쉽게 할 수 있다는 것을 알게 되었죠. 루프 대신 이러한 메서드를 사용하면 앞서 했던 작업이 얼마나 쉬워지는지 살펴보겠습니다. 그에 앞서, 먼저 데이터를 Dask DataFrame으로 불러와야 합니다.

지침

100 XP
  • dask.dataframe 하위 패키지를 dd로 임포트하세요.
  • data/spotify 폴더의 모든 CSV 파일을 최대 블록 크기 1MB로 읽어 오세요.
  • dd.to_datetime() 함수를 사용해 'release_date' 열의 문자열을 datetime으로 변환하세요.
  • DataFrame의 .head() 메서드를 사용해 표의 상위 5개 행을 확인하세요.