1. 学ぶ
  2. /
  3. コース
  4. /
  5. Kerasで学ぶ言語モデリングのためのRecurrent Neural Networks (RNNs)

Connected

演習

学習用データの準備

この演習では、モデルを学習させるためのデータ準備を続けます。文と次の文字の配列を作成したら、それらをモデルで使用できる数値に変換する必要があります。

この手順は、RNN モデルが文字列ではなく数値のみを入力として想定しているため必要です。文章中に存在する文字を表す位置に 0 または 1 を持つ数値配列を作成します。1(または True)は該当する文字が存在することを、0(または False)はその文のその位置に文字が存在しないことを表します。

変数 sentences, next_char, n_vocab, chars_window, num_seqs(学習データ内の文数)は、numpy を np として読み込んだ状態で、すでに環境に用意されています。

指示

100 XP
  • すべてが 0 の np.array() を作成し、shape を (number of sentences, characters window, vocabulary size) に設定します。
  • 辞書 char_to_index を使って、現在の文字に対応する位置を 1 に設定します。
  • 現在の次の文字を 1 に設定します。
  • 各配列の先頭要素を出力してください。