1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python에서 Dask로 병렬 프로그래밍

Connected

Exercises

저장된 텍스트에서 bag 만들기

이번에는 동료가 리뷰를 텍스트 파일로 저장해 두었습니다. 파일이 여러 개이고, 각 파일에는 여러 개의 리뷰가 있습니다. 각 리뷰는 텍스트 파일에서 한 줄로 기록되어 있어요.

이 리뷰들을 Dask로 지연 로딩해 병렬 처리로 더 빠르게 분석하려고 합니다.

dask.bag은 db로 임포트되어 있어요.

คำแนะนำ

100 XP
  • read_text() 함수를 사용해 data/tripadvisor_hotel_reviews 디렉터리 안의 모든 .txt 파일을 불러오세요.
  • bag에 있는 리뷰 개수를 세세요.
  • bag의 .compute() 메서드를 사용해 정답을 출력하세요.