1. 학습
  2. /
  3. 강의
  4. /
  5. purrr로 배우는 중급 함수형 프로그래밍

Connected

연습 문제

URL 분석하기

여전히 #RStudioConf 데이터셋을 탐색하고 있어요. 이번 연습에서는 트윗에 포함된 URL을 분석해 보겠습니다.

URL은 "url_urls"라는 요소에 들어 있어요. 이 "url_urls" 요소에는 트윗에 URL이 없으면 NULL이, 하나 이상이면 URL 목록이 들어갑니다.

먼저 데이터셋에서 모든 "url_urls" 요소를 추출한 다음, purrr와 stringr를 함께 사용해 GitHub 관련 URL 링크가 포함된 트윗이 몇 개인지 세어 볼 거예요. GitHub는 개발자에게 인기 있는 웹사이트이므로, 이 웹사이트의 비율이 높다면 우리 데이터셋에 개발자 커뮤니티가 활발하다는 신호로 볼 수 있어요.

purrr와 stringr는 미리 불러와 두었고, rstudioconf 데이터셋도 작업 공간에 준비되어 있습니다.

지침

100 XP
  • 모든 "urls_url" 요소를 추출하고, 결과를 flatten()에 전달해 계층을 한 단계 제거하세요.

  • 결과에서 NULL을 제거하세요.

  • 문자열에 "github"가 포함되어 있는지 감지하는 매퍼 has_github를 만드세요.

  • 논리형용 map_*() 변형을 has_github와 함께 사용하고, 이를 sum()에 전달해 "github"를 포함하는 링크의 개수를 세세요.