1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Translation with Keras

Connected

Cvičení

Trénování modelu

V tomto cvičení natrénuješ dříve implementovaný model. Věděl/a jsi, že Googlu trval trénink jeho modelu strojového překladu založeného na architektuře enkodér-dekodér 2 až 4 dny?

Pro toto cvičení použiješ malou datovou sadu 1 500 vět (tj. en_text a fr_text). Takové množství dat nestačí na dosažení výborných výsledků, ale postup zůstává stejný – jde jen o trénování na více datech po delší dobu. K dispozici máš také model nmt a funkci sents2seqs(), kterou jsi implementoval/a dříve. Pro lepší výkon budeš v tomto cvičení obracet vstupní text enkodéru. Zde en_x označuje vstup enkodéru, zatímco de_x označuje vstup dekodéru.

Pokyny

100 XP
  • Pomocí funkce sents2seqs() získej jednu dávku vstupů enkodéru (anglické věty od indexu i do i+bsize). Vstupy musí být obrácené a zakódované metodou onehot.
  • Pomocí funkce sents2seqs() získej jednu dávku výstupů dekodéru (francouzské věty od indexu i do i+bsize). Vstupy musí být zakódované metodou onehot.
  • Natrénuj model na jedné dávce dat obsahující en_x a de_y.
  • Vyhodnoť model pro en_x a de_y s hodnotou batch_size nastavenou na bsize a získej výsledné metriky.