1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 사기 탐지

Connected

연습 문제

사전과 코퍼스 생성하기

LDA 토픽 모델을 실행하려면 모델에 입력할 사전(dictionary)과 코퍼스(corpus)를 먼저 정의해야 해요. 이전 연습 문제에서 정제해 둔 텍스트 데이터를 계속 사용하겠습니다. 즉, text_clean이 이미 준비되어 있으니 이를 사용해 사전과 코퍼스를 만들면 됩니다.

이 연습 문제는 평소보다 실행 시간이 조금 더 걸릴 수 있어요.

지침

100 XP
  • gensim 패키지와 gensim의 corpora를 각각 임포트하세요.
  • 정제된 데이터 text_clean에 대해 적절한 함수를 실행해 사전을 정의하세요.
  • text_clean의 각 텍스트에 대해 doc2bow를 실행해 코퍼스를 정의하세요.
  • dictionary와 corpus가 어떻게 생겼는지 확인할 수 있도록 결과를 출력하세요.