1. 학습
  2. /
  3. 강의
  4. /
  5. 셸에서의 데이터 처리

Connected

연습 문제

csvkit으로 데이터 처리하기

데이터셋을 모았더라도, 예측 모델링 같은 고급 분석을 하기 전에는 여전히 데이터를 처리하고 정제해야 합니다. 이 종합 연습에서는 csvkit의 다양한 명령을 활용해 흔히 필요한 데이터 처리와 정제를 해 보겠습니다.

Excel 파일 Spotify_201809_201810.xlsx에는 Spotify201809와 Spotify201810이라는 두 개의 시트(탭)가 들어 있습니다. 먼저 Excel 파일을 각 시트별로 분리하고, 요약 통계를 미리 살펴본 다음, 몇몇 열을 제거하고, 마지막으로 두 시트를 다시 하나로 쌓아서 이후 분석에 바로 쓸 수 있는 단일 csv 파일을 만들겠습니다.

지침 1/3

undefined XP
    1
    2
    3
  • Spotify201809 시트를 Spotify201809.csv라는 이름의 별도 csv 파일로 변환하세요.