1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rekurencyjne sieci neuronowe (RNN) do modelowania języka w Keras

Connected

演習

Tworzenie wektorów zdań i kolejnych znaków

To ćwiczenie kładzie szczególny nacisk na wartość przygotowania danych. Jako dane wejściowe wykorzystasz teksty zawierające frazy wypowiadane przez Sheldona z serialu Teoria wielkiego podrywu, a następnie stworzysz wektory indeksów zdań i kolejnych znaków – niezbędne przed zbudowaniem modelu generowania tekstu.

Tekst jest dostępny w zmiennej sheldon, słownik (zbiór znaków) – w zmiennej vocabulary, a hiperparametry chars_window i step mają wartości odpowiednio 20 i 3. Oznacza to, że do przewidzenia kolejnego znaku używana jest sekwencja 20 znaków, a okno przesuwa się o 3 znaki w każdej iteracji.

W środowisku załadowana jest również biblioteka pandas jako pd.

指示

100 XP
  • Podziel tekst według znaku nowej linii, aby iterować po zdaniach.
  • Przechodź pętlą do końca zdania pomniejszonego o chars_window.
  • Dodaj do zmiennej sentences fragment zdania o długości chars_window znaków, a do zmiennej next_chars – kolejny znak.
  • Użyj uzyskanych wektorów, aby utworzyć pd.DataFrame() i wydrukuj jego pierwsze wiersze.