1. Nauka
  2. /
  3. Kursy
  4. /
  5. Rekurencyjne sieci neuronowe (RNN) do modelowania języka w Keras

Connected

ćwiczenie

Przygotowanie danych do trenowania

W tym ćwiczeniu będziesz kontynuować przygotowanie danych do trenowania modelu. Po utworzeniu tablic zdań i kolejnych znaków musisz przekształcić je na wartości liczbowe, które można wykorzystać w modelu.

Ten krok jest niezbędny, ponieważ modele RNN operują wyłącznie na liczbach, a nie na ciągach znaków. Utworzysz tablice numeryczne, które zawierają zera lub jedynki na pozycjach odpowiadających znakom obecnym w zdaniach. Jedynki (lub True) oznaczają, że dany znak jest obecny, natomiast zera (lub False) wskazują na jego brak na danej pozycji w zdaniu.

Zmienne sentences, next_char, n_vocab, chars_window, num_seqs (liczba zdań w danych treningowych) są już wczytane do środowiska, podobnie jak numpy pod aliasem np.

Instrukcje

100 XP
  • Utwórz np.array() wypełnioną zerami o kształcie (liczba zdań, okno znaków, rozmiar słownika).
  • Użyj słownika char_to_index, aby ustawić pozycję bieżącego znaku na 1.
  • Ustaw bieżący następny znak na 1.
  • Wyświetl pierwszą pozycję każdej tablicy.