Trenowanie modelu opartego na osadzeniach słów

W tym ćwiczeniu nauczysz się implementować proces trenowania modelu tłumaczenia maszynowego wykorzystującego osadzenia słów (word embeddings – wektorowe reprezentacje słów). Każde słowo jest reprezentowane jako pojedyncza liczba zamiast wektora kodowania one-hot, tak jak w poprzednich ćwiczeniach. Model będzie trenowany przez wiele epok, przetwarzając cały zbiór danych partiami.

Do ćwiczenia masz dostęp do danych treningowych (tr_en i tr_fr) w postaci listy zdań. Używamy bardzo małej próbki (1000 zdań) rzeczywistych danych, ponieważ trenowanie na pełnym zbiorze mogłoby zająć bardzo dużo czasu. Masz również dostęp do funkcji sents2seqs() oraz modelu nmt_emb, który zaimplementowałeś w poprzednim ćwiczeniu. Pamiętaj, że en_x oznacza dane wejściowe enkodera, a de_x – dane wejściowe dekodera.

Pobierz pojedynczą partię zdań francuskich bez kodowania one-hot, używając funkcji sents2seqs().
Pobierz wszystkie słowa oprócz ostatniego z de_xy.
Pobierz wszystkie słowa oprócz pierwszego z de_xy_oh (słowa francuskie z kodowaniem one-hot).
Wytrenuj model na pojedynczej partii danych.

ćwiczenie

Trenowanie modelu opartego na osadzeniach słów

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie