1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ不正検知

Connected

Exercise

辞書とコーパスを作成する

LDA のトピックモデルを実行するには、まず辞書とコーパスを定義する必要があります。これらはモデルに渡します。前の演習で作成したクリーンなテキストデータを引き続き使います。つまり、text_clean はすでに利用可能で、これを使って辞書とコーパスを作成します。

この演習は通常より少し実行に時間がかかります。

Instrukcje

100 XP
  • gensim パッケージ全体と、gensim から corpora を個別にインポートします。
  • クリーンデータ text_clean に対して適切な関数を実行し、辞書を定義します。
  • text_clean の各テキストに対して doc2bow を実行し、コーパスを定義します。
  • dictionary と corpus がどのようなものか確認できるように、結果を出力してください。