1. Nauka
  2. /
  3. Kursy
  4. /
  5. Tłumaczenie maszynowe z Keras

Connected

ćwiczenie

Trenowanie modelu opartego na osadzeniach słów

W tym ćwiczeniu nauczysz się implementować proces trenowania modelu tłumaczenia maszynowego wykorzystującego osadzenia słów (word embeddings – wektorowe reprezentacje słów). Każde słowo jest reprezentowane jako pojedyncza liczba zamiast wektora kodowania one-hot, tak jak w poprzednich ćwiczeniach. Model będzie trenowany przez wiele epok, przetwarzając cały zbiór danych partiami.

Do ćwiczenia masz dostęp do danych treningowych (tr_en i tr_fr) w postaci listy zdań. Używamy bardzo małej próbki (1000 zdań) rzeczywistych danych, ponieważ trenowanie na pełnym zbiorze mogłoby zająć bardzo dużo czasu. Masz również dostęp do funkcji sents2seqs() oraz modelu nmt_emb, który zaimplementowałeś w poprzednim ćwiczeniu. Pamiętaj, że en_x oznacza dane wejściowe enkodera, a de_x – dane wejściowe dekodera.

Instrukcje

100 XP
  • Pobierz pojedynczą partię zdań francuskich bez kodowania one-hot, używając funkcji sents2seqs().
  • Pobierz wszystkie słowa oprócz ostatniego z de_xy.
  • Pobierz wszystkie słowa oprócz pierwszego z de_xy_oh (słowa francuskie z kodowaniem one-hot).
  • Wytrenuj model na pojedynczej partii danych.