1. Learn
  2. /
  3. Courses
  4. /
  5. R로 소셜 미디어 데이터 분석하기

Connected

Exercise

토픽 모델 만들기

토픽 모델링은 방대한 텍스트에서 주제를 자동으로 찾아내는 작업입니다.

트윗 텍스트로부터 토픽 모델을 만들면 방대한 정보를 여러 뚜렷한 주제로 빠르게 요약하고 인사이트를 얻을 수 있어요.

이번 연습 문제에서는 "Climate change"에 관한 트윗에서 서로 다른 주제를 추출해 보겠습니다.

"Climate change" 트윗의 DTM은 dtm_climate_new로 미리 로드되어 있습니다.

이 연습 문제에는 topicmodels 라이브러리가 미리 로드되어 있습니다.

Instructions 1/2

undefined XP
  • 1
    • DTM에서 잠재 디리클레 할당(LDA)을 사용해 토픽 5개의 토픽 모델을 만드세요.
    • 생성한 토픽 모델에서 상위 10개 용어를 선택해 확인하세요.
  • 2
    • 이번에는 LDA를 다시 사용해 DTM에서 네 개의 토픽으로 구성된 토픽 모델을 만드세요.
    • 새 토픽 모델에서 상위 여섯 개 용어를 선택해 확인하세요.