Przewidywanie tekstu z użyciem LSTM

W kolejnych ćwiczeniach zbudujesz uproszczony model LSTM, który potrafi przewidzieć następne słowo na podstawie małego zbioru danych tekstowych. Zbiór ten zawiera oczyszczone cytaty z filmów Władca Pierścieni. Znajdziesz je w zmiennej text.

Zamienisz ten text na sequences (sekwencje) o długości 4 i skorzystasz z Keras Tokenizer, aby przygotować cechy i etykiety dla modelu!

Keras Tokenizer jest już zaimportowany i gotowy do użycia. Przypisuje każdemu unikalnemu słowu unikalną liczbę i przechowuje te mapowania w słowniku. To ważne, ponieważ model operuje na liczbach – a później będziemy chcieli dekodować wyniki z powrotem na słowa.

Podziel tekst na tablicę słów za pomocą .split().
Utwórz zdania złożone z 4 słów, przesuwając się o jedno słowo na raz.
Utwórz instancję Tokenizer(), a następnie dopasuj ją do zdań za pomocą .fit_on_texts().
Przekształć sentences w sekwencję liczb, wywołując .texts_to_sequences().

ćwiczenie

Przewidywanie tekstu z użyciem LSTM

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie