1. Nauka
  2. /
  3. Kursy
  4. /
  5. Rekurencyjne sieci neuronowe (RNN) do modelowania języka w Keras

Connected

ćwiczenie

Przygotowanie danych tekstowych jako wejścia do modelu

Wcześniej nauczyłeś się tworzyć słowniki mapujące indeksy na słowa i odwrotnie. W tym ćwiczeniu podzielisz tekst na znaki i będziesz kontynuować przygotowywanie danych do uczenia nadzorowanego.

Podział tekstu na znaki może wydawać się dziwny, ale jest powszechnie stosowany w generowaniu tekstu. Proces przygotowania danych pozostaje taki sam – jedyna różnica polega na sposobie podziału tekstu.

Stworzysz dane treningowe zawierające listę tekstów o stałej długości oraz ich etykiety, czyli odpowiadające im następne znaki.

Będziesz nadal korzystać ze zbioru danych zawierającego cytaty Sheldona (z serialu The Big Bang Theory), dostępnego w zmiennej sheldon_quotes.

Funkcja print_examples() wyświetla pary, dzięki czemu możesz zobaczyć, jak dane zostały przekształcone. Użyj help(), aby poznać szczegóły.

Instrukcje

100 XP
  • Ustaw step równe 2, a chars_window równe 10.
  • Dołącz następne zdanie do zmiennej sentences.
  • Dołącz odpowiednią pozycję tekstu sheldon do zmiennej next_chars.
  • Użyj funkcji print_examples(), aby wyświetlić 10 zdań wraz z następnymi znakami.