1. 学ぶ
  2. /
  3. コース
  4. /
  5. R로 배우는 자연어 처리 입문

Connected

演習

BoW 예제

문헌고찰에서는 연구자들이 특정 주제에 대해 가능한 한 많은 텍스트를 읽고 요약합니다. 이 과정에서 중복된 글을 읽거나 이미 읽은 글의 요약을 다시 읽게 되기도 해요. 여러분에게는 원유(crude oil)에 관한 20편의 기사가 R 객체 crude_tibble로 주어졌습니다. 각 기사를 곧장 읽기보다, 우선 이 기사들에서 어떤 단어들이 공통으로 등장하는지 살펴보려 합니다. 이를 위해 텍스트의 bag-of-words 표현부터 만들어 보겠습니다.

指示

100 XP
  • article_id 열을 사용해 기사별 단어 수를 세어 BoW 표현을 만드세요.
  • 출력 결과를 사용해 고유한 기사/단어 조합이 몇 개 생성되었는지 확인하세요.
  • 결과를 'prices' 언급으로 필터링하세요.
  • prices라는 단어가 사용된 기사는 몇 편인가요?