1. Learn
  2. /
  3. Courses
  4. /
  5. Machine Translation with Keras

Connected

Exercise

Předzpracování dat

Teď je potřeba zpracovat data pro náš nový model, který má dva vstupy a jeden výstup. Těmito dvěma vstupy jsou anglická slova zakódovaná metodou one-hot a francouzská slova zakódovaná metodou one-hot bez posledního slova.

Výstupem budou francouzská slova zakódovaná metodou one-hot bez prvního slova. Jinými slovy, v dekodéru má každé vstupní francouzské slovo jako výstup slovo následující. Tady se naučíš, jak to implementovat.

Máš k dispozici funkci sents2seqs(), proměnné en_text a fr_text.

Instructions

100 XP
  • Získej dávku vstupů enkodéru (od i do i+bsize) pomocí funkce sents2seqs() (zakódované metodou one-hot a obrácené).
  • Získej dávku vstupů a výstupů dekodéru (od i do i+bsize) pomocí funkce sents2seqs() (zakódované metodou one-hot).
  • Odděl vstupy dekodéru (všechna francouzská slova kromě posledního) z de_xy pomocí řezu na časové dimenzi.
  • Odděl výstupy dekodéru (všechna francouzská slova kromě prvního) z de_xy.