1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 자연어 처리 입문

Connected

연습 문제

LDA 결과 검토

주요 인물인 Napoleon을 언급한 Animal Farm의 문장들에 대해 5개의 토픽을 가진 토픽 모델 napoleon_model을 구축했어요. 각 토픽의 상위 단어와 상위 문장을 5명의 현지 필자가 검토했고, 각 토픽의 주제를 제공했습니다.

결과를 마무리하기 위해 토픽에 대한 요약 통계를 준비하세요. 이 요약 값들을 주제와 함께 상사에게 검토 자료로 제출할 예정입니다.

지침

100 XP
  • 토픽 모델 napoleon_model에서 gamma 행렬을 추출하세요.
  • dplyr 함수를 사용해 각 문장에서 가장 높은 토픽을 나타내는 tibble grouped_gammas를 만드세요.
  • grouped_gammas를 사용해 각 토픽과 가장 유사한 문장의 개수를 세세요.
  • grouped_gammas를 사용해 각 토픽의 평균 gamma 값을 계산하세요.