1. 学ぶ
  2. /
  3. コース
  4. /
  5. Kerasで学ぶMachine Translation

Connected

演習

単語埋め込みベースのモデルを学習させる

ここでは、単語埋め込みを使う機械翻訳モデルの学習手順を実装します。単語は、前の演習で行った one-hot ベクトルではなく、単一の数値として表現します。データセット全体をバッチでたどりながら、複数エポックにわたってモデルを学習します。

この演習では、文のリスト形式の学習データ(tr_en と tr_fr)が用意されています。学習に時間がかかりすぎないよう、実データのうちごく少数(1000 文)のサンプルのみを使用します。前の演習で実装した sents2seqs() 関数とモデル nmt_emb も利用できます。en_x はエンコーダの入力、de_x はデコーダの入力を指すことを思い出してください。

指示

100 XP
  • sents2seqs() 関数を使い、one-hot エンコードを行わずにフランス語文の単一バッチを取得します。
  • de_xy からは、最後 以外のすべての単語を取得します。
  • de_xy_oh(one-hot で表現されたフランス語の単語)からは、最初 以外のすべての単語を取得します。
  • 単一バッチのデータでモデルを学習させます