1. 학습
  2. /
  3. 강의
  4. /
  5. R로 소셜 미디어 데이터 분석하기

Connected

연습 문제

토픽 모델 만들기

토픽 모델링은 방대한 텍스트에서 주제를 자동으로 찾아내는 작업입니다.

트윗 텍스트로부터 토픽 모델을 만들면 방대한 정보를 여러 뚜렷한 주제로 빠르게 요약하고 인사이트를 얻을 수 있어요.

이번 연습 문제에서는 "Climate change"에 관한 트윗에서 서로 다른 주제를 추출해 보겠습니다.

"Climate change" 트윗의 DTM은 dtm_climate_new로 미리 로드되어 있습니다.

이 연습 문제에는 topicmodels 라이브러리가 미리 로드되어 있습니다.

지침 1/2

undefined XP
  • 1
    • DTM에서 잠재 디리클레 할당(LDA)을 사용해 토픽 5개의 토픽 모델을 만드세요.
    • 생성한 토픽 모델에서 상위 10개 용어를 선택해 확인하세요.
  • 2
    • 이번에는 LDA를 다시 사용해 DTM에서 네 개의 토픽으로 구성된 토픽 모델을 만드세요.
    • 새 토픽 모델에서 상위 여섯 개 용어를 선택해 확인하세요.