1. Nauka
  2. /
  3. Kursy
  4. /
  5. Tłumaczenie maszynowe z Keras

Connected

ćwiczenie

Dodawanie tokenów specjalnych

Teraz nauczysz się dodawać tokeny sos (oznaczający początek) i eos (oznaczający koniec) do zdań. Jak już wspomniano, ten krok jest opcjonalny w przypadku modelu, z którym pracujesz teraz, ale będzie wymagany w modelu, który zaimplementujesz w późniejszym rozdziale.

Do dodawania tych tokenów specjalnych użyjesz funkcji string.join() z Pythona. Funkcja string.join() łączy listę ciągów znaków w jeden ciąg, używając określonego separatora. Na przykład, aby przekształcić ['datacamp', 'is', 'awesome'] w 'datacamp is awesome', możesz użyć " ".join(['datacamp', 'is', 'awesome']), gdzie " " (czyli znak spacji) jest separatorem.

Na potrzeby tego ćwiczenia zaimportowano już niewielką próbkę 10 zdań w języku francuskim.

Instrukcje

100 XP
  • Przejdź pętlą przez listę zdań francuskich (fr_text).
  • Dodaj token "sos" oznaczający początek oraz token "eos" oznaczający koniec każdego zdania, używając funkcji string.join().
  • Dołącz zmodyfikowane zdanie do fr_text_new.
  • Wyświetl zmodyfikowane zdanie sent_new.