Trenowanie modelu

W tym ćwiczeniu wytrenujesz wcześniej zaimplementowany model. Czy wiesz, że model tłumaczenia maszynowego oparty na architekturze enkoder-dekoder firmy Google wymagał 2–4 dni trenowania?

W tym ćwiczeniu będziesz korzystać z małego zbioru danych zawierającego 1500 zdań (tj. en_text i fr_text). Taka ilość danych nie wystarczy do osiągnięcia wysokiej jakości tłumaczeń, ale metoda pozostaje taka sama – chodzi o trenowanie na większej ilości danych przez dłuższy czas. Masz też dostęp do modelu nmt oraz funkcji sents2seqs(), którą zaimplementowałeś wcześniej. W tym ćwiczeniu odwrócimy tekst wejściowy enkodera, aby poprawić jakość modelu. Tutaj en_x oznacza dane wejściowe enkodera, natomiast de_x oznacza dane wejściowe dekodera.

Pobierz pojedynczą partię danych wejściowych enkodera (zdania angielskie od indeksu i do i+bsize) przy użyciu funkcji sents2seqs(). Dane wejściowe muszą być odwrócone i zakodowane metodą one-hot.
Pobierz pojedynczą partię danych wyjściowych dekodera (zdania francuskie od indeksu i do i+bsize) przy użyciu funkcji sents2seqs(). Dane wejściowe muszą być zakodowane metodą one-hot.
Wytrenuj model na pojedynczej partii danych zawierającej en_x i de_y.
Wyznacz metryki ewaluacji dla en_x i de_y, oceniając model z parametrem batch_size ustawionym na bsize.

Exercise

Trenowanie modelu

Instructions

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Exercise

Instructions

Exercise