1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wprowadzenie do uczenia głębokiego z Keras

Connected

ćwiczenie

Przewidywanie tekstu z użyciem LSTM

W kolejnych ćwiczeniach zbudujesz uproszczony model LSTM, który potrafi przewidzieć następne słowo na podstawie małego zbioru danych tekstowych. Zbiór ten zawiera oczyszczone cytaty z filmów Władca Pierścieni. Znajdziesz je w zmiennej text.

Zamienisz ten text na sequences (sekwencje) o długości 4 i skorzystasz z Keras Tokenizer, aby przygotować cechy i etykiety dla modelu!

Keras Tokenizer jest już zaimportowany i gotowy do użycia. Przypisuje każdemu unikalnemu słowu unikalną liczbę i przechowuje te mapowania w słowniku. To ważne, ponieważ model operuje na liczbach – a później będziemy chcieli dekodować wyniki z powrotem na słowa.

Instrukcje

100 XP
  • Podziel tekst na tablicę słów za pomocą .split().
  • Utwórz zdania złożone z 4 słów, przesuwając się o jedno słowo na raz.
  • Utwórz instancję Tokenizer(), a następnie dopasuj ją do zdań za pomocą .fit_on_texts().
  • Przekształć sentences w sekwencję liczb, wywołując .texts_to_sequences().