1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do hlubokého učení s Keras

Connected

Cvičení

Předpovídání textu pomocí LSTM

V následujících cvičeních sestavíš jednoduchý LSTM model schopný předpovídat další slovo na základě malé textové sady. Tato sada se skládá z upravených citátů z filmů Pán prstenů. Najdeš je v proměnné text.

Tento text převedeš na sequences o délce 4 slov a využiješ Keras Tokenizer k přípravě příznaků a štítků pro svůj model!

Keras Tokenizer je už naimportovaný a připravený k použití. Každému jedinečnému slovu přiřadí unikátní číslo a uloží mapování do slovníku. To je důležité, protože model pracuje s čísly – a my budeme chtít výstupní čísla zpětně dekódovat na slova.

Pokyny

100 XP
  • Rozděl text na pole slov pomocí .split().
  • Vytvoř věty po 4 slovech, vždy s posunem o jedno slovo.
  • Vytvoř instanci Tokenizer() a natrénuj ji na větách pomocí .fit_on_texts().
  • Převeď sentences na posloupnost čísel voláním .texts_to_sequences().