1. 학습
  2. /
  3. 강의
  4. /
  5. R 중급

Connected

연습 문제

sub & gsub (2)

정규 표현식은 직접 해 보면서, 그리고 다른 예시를 보면서 익히는 개념이에요. 이번 연습 문제의 정규 표현식을 고민하기 전에, 새로 사용할 요소들을 먼저 살펴보세요:

  • .*: 단골 손님이죠! "임의의 문자, 0회 이상 반복"으로 읽을 수 있어요.
  • \\s: 공백 문자와 일치합니다. 보통 "s"는 일반 문자이지만, 이를 이스케이프(\\)하면 메타문자가 돼요.
  • [0-9]+: 0부터 9까지의 숫자가 1회 이상(+) 반복되는 패턴과 일치합니다.
  • ([0-9]+): 괄호는 매칭된 문자열의 일부를 캡처해 교체 문자열에서 참조할 수 있게 해요. sub()의 replacement 인수에 있는 \\1은 정규 표현식 [0-9]+에 의해 캡처된 문자열로 설정됩니다.
awards <- c("Won 1 Oscar.",
  "Won 1 Oscar. Another 9 wins & 24 nominations.",
  "1 win and 2 nominations.",
  "2 wins & 3 nominations.",
  "Nominated for 2 Golden Globes. 1 more win & 2 nominations.",
  "4 wins & 1 nomination.")

sub(".*\\s([0-9]+)\\snomination.*$", "\\1", awards)

이 코드 조각은 무엇을 반환할까요? awards는 워크스페이스에 이미 정의되어 있으니, 지금 바로 콘솔에서 실행해 보셔도 됩니다.

지침

50 XP

가능한 답변