1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Translation with Keras

Connected

Cvičení

Tokenizace vět pomocí Keras

V tomto cvičení si vyzkoušíš práci s Keras Tokenizerem. Keras Tokenizer je skvělý nástroj, který ti umožní provádět klíčové zpracování textu jen s pár řádky kódu. Například Keras Tokenizer automaticky přiřadí slovům ve tvém slovníku odpovídající ID jediným voláním funkce. Tady se o tom dozvíš víc.

Vytvoříš objekt Keras Tokenizer a natrénuješ ho na textu, čímž Tokenizeru umožníš sestavit slovník slov a jejich příslušných ID. Text použitý k trénování Tokenizeru pochází z Udacity Github Repo.

Pokyny

100 XP
  • Definuj objekt Keras Tokenizer.
  • Natrénuj tokenizér na en_text.
  • Získej ID slova pro každé slovo w z daného seznamu ["january", "apples", "summer"].
  • Vypiš slovo a jeho příslušné ID.