1. Учиться
  2. /
  3. Courses
  4. /
  5. R로 배우는 자연어 처리 입문

Connected

Exercise

문서에 토픽 할당하기

LDA 모델은 결과를 해석하고 활용하지 못하면 무의미해요. 문장 모음 pig_sentences에 대해 LDA 모델 sentence_lda를 실행한 결과가 주어졌어요. 어떤 LDA 분석 결과든 제대로 이해하려면 토픽별 상위 단어를 담은 beta와 문서별 상위 토픽을 담은 gamma 두 행렬을 모두 살펴봐야 해요.

이 두 행렬에 대해 알고 있는 내용을 바탕으로, 특정 토픽의 결과를 추출하고 출력이 예상과 맞는지 확인해 보세요.

Инструкции

100 XP
  • beta와 gamma 행렬 각각에 대해 tibble을 만드세요.
  • 토픽 5의 상위 단어를 확인하고, 결과를 beta 값이 큰 순서로 정렬해 토픽 5를 탐색하세요.
  • 토픽 5와 가장 잘 맞는 문장이 무엇인지 확인하고, 결과를 gamma 값이 큰 순서로 정렬해 토픽 5를 탐색하세요.