Předpovídání textu pomocí LSTM

V následujících cvičeních sestavíš jednoduchý LSTM model schopný předpovídat další slovo na základě malé textové sady. Tato sada se skládá z upravených citátů z filmů Pán prstenů. Najdeš je v proměnné text.

Tento text převedeš na sequences o délce 4 slov a využiješ Keras Tokenizer k přípravě příznaků a štítků pro svůj model!

Keras Tokenizer je už naimportovaný a připravený k použití. Každému jedinečnému slovu přiřadí unikátní číslo a uloží mapování do slovníku. To je důležité, protože model pracuje s čísly – a my budeme chtít výstupní čísla zpětně dekódovat na slova.

Rozděl text na pole slov pomocí .split().
Vytvoř věty po 4 slovech, vždy s posunem o jedno slovo.
Vytvoř instanci Tokenizer() a natrénuj ji na větách pomocí .fit_on_texts().
Převeď sentences na posloupnost čísel voláním .texts_to_sequences().

अभ्यास

Předpovídání textu pomocí LSTM

निर्देश

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}अभ्यास

निर्देश

अभ्यास