Przygotowanie danych tekstowych jako wejścia do modelu

Wcześniej nauczyłeś się tworzyć słowniki mapujące indeksy na słowa i odwrotnie. W tym ćwiczeniu podzielisz tekst na znaki i będziesz kontynuować przygotowywanie danych do uczenia nadzorowanego.

Podział tekstu na znaki może wydawać się dziwny, ale jest powszechnie stosowany w generowaniu tekstu. Proces przygotowania danych pozostaje taki sam – jedyna różnica polega na sposobie podziału tekstu.

Stworzysz dane treningowe zawierające listę tekstów o stałej długości oraz ich etykiety, czyli odpowiadające im następne znaki.

Będziesz nadal korzystać ze zbioru danych zawierającego cytaty Sheldona (z serialu The Big Bang Theory), dostępnego w zmiennej sheldon_quotes.

Funkcja print_examples() wyświetla pary, dzięki czemu możesz zobaczyć, jak dane zostały przekształcone. Użyj help(), aby poznać szczegóły.

Ustaw step równe 2, a chars_window równe 10.
Dołącz następne zdanie do zmiennej sentences.
Dołącz odpowiednią pozycję tekstu sheldon do zmiennej next_chars.
Użyj funkcji print_examples(), aby wyświetlić 10 zdań wraz z następnymi znakami.

ćwiczenie

Przygotowanie danych tekstowych jako wejścia do modelu

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie