1. 학습
  2. /
  3. 강의
  4. /
  5. 셸에서의 데이터 처리

Connected

연습 문제

Wget과 curl로 데이터 다운로드

데이터 분석 프로젝트를 시작할 때는 먼저 모든 데이터를 한곳에 모아두는 것이 좋습니다. 보통은 HTTP 서버나 데이터베이스 등 여러 위치에서 데이터를 내려받아 가져오게 됩니다.

curl은 단일 파일을 받을 때 유용하지만, 여러 파일을 한꺼번에 처리하기에는 다소 불편합니다. 이 마무리 연습에서는 curl과 Wget을 모두 사용해 월별 Spotify 파일을 연속으로 내려받고, 간단히 처리한 뒤, 받은 모든 파일을 로컬 디렉터리에 정리하겠습니다.

지침

100 XP
  • curl을 사용해 축약(리디렉션)된 URL에서 압축된 201812SpotifyData 데이터를 다운로드하고, 같은 단계에서 파일 이름을 Spotify201812.zip으로 바꾸세요.
  • Spotify201812.zip의 압축을 풀고, 원본 압축 파일을 삭제한 다음, 풀린 파일 이름을 일관성을 위해 Spotify201812.csv로 바꾸세요.
  • url_list.txt와 Wget을 사용해 Spotify201809.csv, Spotify201810.csv, Spotify201811.csv 세 파일을 한 번에 다운로드하되, 최대 다운로드 속도를 2500KB/s로 제한하세요.