1. 학습
  2. /
  3. 강의
  4. /
  5. R 중급 정규 표현식

Connected

연습 문제

고급 정규 표현식으로 추출하기

이번 연습에서는 이전 연습을 바탕으로 더 고급 정규 표현식을 만들어, screens_per_movie 데이터 프레임의 각 행에서 영화 제목, 배급사(company) 이름, 상영 스크린 수를 포착해 보겠습니다.

screens_per_movie의 각 행에는 이 세 부분이 모두 들어 있습니다. extract를 사용해 이 세 가지를 추출하고, 정확히 원하는 정보만 담은 세 개의 새 열을 표 형태의 구조화된 데이터로 얻을 거예요. 비정형 텍스트에서 의미를 끌어내어 이후에 분석하고 시각화할 수 있는 형태로 바꾸려면 이 단계가 핵심입니다.

지침 1/3

undefined XP
    1
    2
    3
  • 먼저 screens_per_movie의 첫 세 행을 살펴보고 데이터 구조에 익숙해지세요.