1. 학습
  2. /
  3. 강의
  4. /
  5. R의 병렬 프로그래밍

Connected

연습 문제

반복(iterate)하고 필터링하기

데이터 컨설턴트로서 여러 형태와 포맷의 데이터를 받게 됩니다. 방금 한 클라이언트가 전 세계 고등교육 기관 데이터를 담은 40GB짜리 CSV 파일을 전달했습니다.

주니어 애널리스트들은 메모리 부족으로 데이터를 제대로 파싱하지 못하고 있으며, 전체 데이터셋을 처리할 컴퓨팅 자원에 대한 예산도 없습니다. 현재 분석에서는 호주의 기관만 필요합니다. CSV의 파일 경로는 이미 변수 filepath에 저장되어 있습니다. 이 데이터를 위한 효율적인 리더를 구현해 달라고 요청받았습니다. parallel, doParallel, foreach, iterators 패키지는 미리 불러와 두었습니다.

지침

100 XP
  • 이터레이터를 사용해 filepath에서 줄 단위로 읽으세요.
  • 적절한 함수를 이용해 결과를 결합해 데이터 프레임을 만드세요.
  • 병렬 연산자를 지정하세요.