1. Uczyć się
  2. /
  3. Courses
  4. /
  5. R로 배우는 자연어 처리 입문

Connected

Exercise

퍼플렉시티 테스트

2016년 미국 대선 기간에 트윗 봇이 보낸 트윗으로 구성된 데이터셋이 주어졌습니다. 상사는 관심 있는 두 가지 계정 유형인 Left와 Right를 확인했으며, Right 트윗 봇의 트윗에 대해 토픽 모델링을 수행해 달라고 요청했습니다. 또한 이 트윗들의 내용을 토픽 모델링으로 요약하길 원합니다. 데이터에 포함된 토픽 수의 대략적인 규모를 파악하기 위해 5, 15, 50개의 토픽으로 각각 토픽 모델링을 수행하세요.

Instrukcje 1 / 3

undefined XP
  • 1
    • 5개의 토픽에 대해 'Gibbs' 방법으로 LDA를 수행하고 train과 test 데이터셋 각각의 퍼플렉시티 점수를 출력하세요.
  • 2
    • 15개의 토픽으로 토픽 모델링을 수행하세요.
  • 3
    • 50개의 토픽으로 토픽 모델링을 수행하세요.