1. Învăţa
  2. /
  3. Courses
  4. /
  5. Kerasで学ぶ言語モデリングのためのRecurrent Neural Networks (RNNs)

Connected

exercise

モデル入力のためのテキスト前処理

これまでに、単語からインデックス、インデックスから単語への辞書を作成する方法を学びました。この演習では、テキストを文字単位に分割し、教師あり学習用にデータの準備を進めます。

テキストを文字に分割するのは不思議に思えるかもしれませんが、テキスト生成ではよく行われます。データ準備の手順自体は同じで、変わるのはテキストの分割方法だけです。

固定長のテキストと、そのラベルである直後の文字の対応からなる学習用データを作成します。

Sheldon(The Big Bang Theory)の引用が入ったデータセットを、変数 sheldon_quotes として引き続き使用します。

print_examples() 関数は変換後のペアを表示します。詳細は help() を参照してください。

Instrucţiuni

100 XP
  • step を 2、chars_window を 10 に設定します。
  • 次の文を変数 sentences に追加します。
  • テキスト sheldon の正しい位置を変数 next_chars に追加します。
  • print_examples() 関数を使って、10 個の文と次の文字を表示します。