1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Rekurentní neuronové sítě (RNN) pro jazykové modelování s Keras

Connected

cvičení

Vytvoření vektorů vět a následujících znaků

Toto cvičení zdůrazňuje důležitost přípravy dat. Jako vstup použiješ texty s frázemi postavy Sheldona z televizního seriálu Teorie velkého třesku a vytvoříš vektory indexů vět a následujících znaků, které jsou potřeba před vytvořením modelu pro generování textu.

Text je dostupný v proměnné sheldon, slovník (znaky) v proměnné vocabulary a hyperparametry chars_window a step mají nastavené hodnoty 20 a 3. To znamená, že k předpovědi dalšího znaku se použije sekvence 20 znaků a okno se při každé iteraci posune o 3 znaky.

V prostředí je také načten balíček pandas jako pd.

Pokyny

100 XP
  • Rozděl text podle zalomení řádku, abys mohl/a procházet jednotlivé věty.
  • Procházej smyčku až do konce věty minus chars_window.
  • Přidej část věty o délce chars_window znaků do proměnné sentences a následující znak přidej do proměnné next_chars.
  • Pomocí získaných vektorů vytvoř pd.DataFrame() a vypiš jeho první řádky.