1. 学ぶ
  2. /
  3. コース
  4. /
  5. Kerasで学ぶMachine Translation

Connected

演習

学習用データと検証用データへの分割

学習用データセットと検証用データセットを作成します。検証用データセットを保持し、そのセットでのモデルの性能を監視することは、過学習を避けるためのよいプラクティスです。

この演習では、en_text(英語の文)とfr_text(フランス語の文)が与えられています。

指示

100 XP
  • np.arange() を使って、0 から始まり en_text のサイズを持つインデックス列を定義します。
  • そのインデックス列の先頭 train_size 個を train_inds として定義します。
  • リスト en_text と fr_text から、train_inds で指定された位置の文を取り出し、tr_en と tf_fr を定義します。
  • リスト en_text と fr_text から、valid_inds で指定された位置の文を取り出し、v_en と v_fr を定義します。