1. 학습
  2. /
  3. 강의
  4. /
  5. tidyr로 데이터 재구조화하기

Connected

연습 문제

한 열에 여러 변수 담기

바쁘신 만큼 Netflix에 너무 많은 시간을 쓰고 싶지 않아서, 무엇을 볼지 정하기 전에 TV 프로그램과 영화의 재생 시간을 간단히 분석해 보려고 해요. netflix_df라는 데이터셋을 구했지만, duration 열에 문제가 있어요. 이 열은 재생 시간의 값과 단위를 함께 담은 문자열로 되어 있으며 단위는 "min" 또는 "Season"이에요.

각 변수가 자기만의 열을 갖도록 이 데이터셋을 정리해 보세요.

이 강의 전반과 마찬가지로 tidyr 패키지는 미리 로드되어 있어요.

지침

100 XP
  • R 콘솔에서 netflix_df를 그대로 입력하고 Enter를 눌러 duration 열에서 값과 단위를 구분하는 문자열이 무엇인지 확인하세요.
  • duration 열을 value와 unit이라는 두 변수로 분리하세요. 숫자와 단위를 구분하는 문자열을 sep 인수에 전달하세요.