1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 자연어 처리 입문

Connected

연습 문제

코퍼스 만들기

텍스트 분석을 수행하기 위해 2016년 미국 선거 주기에 봇이 자동 생성한 약 20,000개의 트윗이 담긴 russian_tweets 티블을 만들었어요. 여러 분석 옵션을 살펴본 결과, 이번에 하려는 작업에는 tm 패키지가 가장 손쉬운 방법을 제공한다고 판단했어요. 분석을 진행하려면 먼저 코퍼스를 만들고, 유용할 수 있는 메타데이터를 연결해야 합니다.

이 데이터는 실제 Twitter 데이터이므로, 비속어 또는 불쾌감을 줄 수 있는 표현이 포함될 위험이 항상 있습니다(이번 연습 문제뿐 아니라 실제 Twitter 데이터를 사용하는 이후의 연습 문제에도 해당됩니다).

지침

100 XP
  • russian_tweets의 content 열을 사용해 코퍼스를 만드세요.
  • following과 followers 두 열을 모두 tweet_corpus의 메타데이터로 연결하세요.
  • 메타데이터 표의 처음 몇 행을 출력하세요.