1. Nauka
  2. /
  3. Kursy
  4. /
  5. Rekurencyjne sieci neuronowe (RNN) do modelowania języka w Keras

Connected

ćwiczenie

Przetwarzanie wstępne w Keras

Drugim ważnym modułem Keras jest keras.preprocessing. Zobaczysz, jak korzystać z jego najważniejszych modułów i funkcji, aby przygotować surowe dane w odpowiednim kształcie wejściowym. Keras oferuje funkcjonalności zastępujące podejście słownikowe, które poznałeś wcześniej.

Użyjesz modułu keras.preprocessing.text.Tokenizer, aby zbudować słownik słów metodą .fit_on_texts(), a następnie przekształcisz teksty na numeryczne identyfikatory reprezentujące indeks każdego słowa w słowniku za pomocą metody .texts_to_sequences().

Następnie użyj funkcji .pad_sequences() z modułu keras.preprocessing.sequence, aby wyrównać długość wszystkich sekwencji (co jest wymagane przez model) – krótsze teksty zostaną dopełnione zerami, a dłuższe obcięte.

Instrukcje

100 XP
  • Zaimportuj Tokenizer i pad_sequences z odpowiednich modułów.
  • Dopasuj obiekt tokenizer do przykładowych danych zapisanych w zmiennej texts.
  • Przekształć teksty na sekwencje numerycznych indeksów za pomocą metody .texts_to_sequences().
  • Wyrównaj rozmiar tekstów, dopełniając je odpowiednimi wartościami.