1. Learn
  2. /
  3. Courses
  4. /
  5. Tłumaczenie maszynowe z Keras

Connected

Exercise

Trenowanie modelu

W tym ćwiczeniu wytrenujesz wcześniej zaimplementowany model. Czy wiesz, że model tłumaczenia maszynowego oparty na architekturze enkoder-dekoder firmy Google wymagał 2–4 dni trenowania?

W tym ćwiczeniu będziesz korzystać z małego zbioru danych zawierającego 1500 zdań (tj. en_text i fr_text). Taka ilość danych nie wystarczy do osiągnięcia wysokiej jakości tłumaczeń, ale metoda pozostaje taka sama – chodzi o trenowanie na większej ilości danych przez dłuższy czas. Masz też dostęp do modelu nmt oraz funkcji sents2seqs(), którą zaimplementowałeś wcześniej. W tym ćwiczeniu odwrócimy tekst wejściowy enkodera, aby poprawić jakość modelu. Tutaj en_x oznacza dane wejściowe enkodera, natomiast de_x oznacza dane wejściowe dekodera.

Instructions

100 XP
  • Pobierz pojedynczą partię danych wejściowych enkodera (zdania angielskie od indeksu i do i+bsize) przy użyciu funkcji sents2seqs(). Dane wejściowe muszą być odwrócone i zakodowane metodą one-hot.
  • Pobierz pojedynczą partię danych wyjściowych dekodera (zdania francuskie od indeksu i do i+bsize) przy użyciu funkcji sents2seqs(). Dane wejściowe muszą być zakodowane metodą one-hot.
  • Wytrenuj model na pojedynczej partii danych zawierającej en_x i de_y.
  • Wyznacz metryki ewaluacji dla en_x i de_y, oceniając model z parametrem batch_size ustawionym na bsize.