1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Translation with Keras

Connected

Cvičení

Rozdělení dat na trénovací a validační sadu

Vytvoříš trénovací a validační datové sady. Udržovat validační sadu a sledovat výkon modelu na ní je dobrá praxe, jak předejít overfittingu.

Pro toto cvičení máš k dispozici en_text (anglické věty) a fr_text (francouzské věty).

Pokyny

100 XP
  • Definuj posloupnost indexů pomocí np.arange(), která začíná od 0 a má velikost en_text.
  • Definuj train_inds jako prvních train_size indexů z této posloupnosti.
  • Definuj tr_en a tf_fr, které obsahují věty na indexech určených proměnnou train_inds ze seznamů en_text a fr_text.
  • Definuj v_en a v_fr, které obsahují věty na indexech určených proměnnou valid_inds ze seznamů en_text a fr_text.