1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Rekurentní neuronové sítě (RNN) pro jazykové modelování s Keras

Connected

cvičení

Příprava dat pro trénování

V tomto cvičení budeš pokračovat v přípravě dat pro trénování modelu. Po vytvoření polí vět a následujících znaků je potřeba převést je na číselné hodnoty, se kterými model dokáže pracovat.

Tento krok je nezbytný, protože RNN modely pracují výhradně s čísly, nikoli s řetězci. Vytvoříš číselná pole obsahující nuly nebo jedničky na pozicích odpovídajících znakům přítomným ve větách. Jednička (nebo True) znamená, že daný znak je na dané pozici přítomen, nula (nebo False) jeho absenci.

Proměnné sentences, next_char, n_vocab, chars_window, num_seqs (počet vět v trénovacích datech) jsou v prostředí již načteny, stejně jako numpy pod aliasem np.

Pokyny

100 XP
  • Vytvoř np.array() vyplněné nulami ve tvaru (počet vět, okno znaků, velikost slovníku znaků).
  • Pomocí slovníku char_to_index nastav pozici aktuálního znaku na 1.
  • Nastav aktuální následující znak na 1.
  • Vypiš první pozici každého pole.