1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Rekurentní neuronové sítě (RNN) pro jazykové modelování s Keras

Connected

cvičení

Předzpracování dat

Naučil/a ses, v čem se liší předzpracování dat pro případ multi-class klasifikace. Teď to vyzkoušíme v praxi – předzpracujeme data, abychom mohli sestavit jednoduchý model pro multi-class klasifikaci.

Dataset je načtený v proměnné news_dataset a má tyto atributy:

  • news_dataset.data: pole s texty
  • news_dataset.target: pole s cílovými kategoriemi jako číselné indexy

Vzorová data obsahují 5 000 pozorování.

Pokyny

100 XP
  • Vytvoř instanci třídy Tokenizer a ulož ji do proměnné tokenizer.
  • Natrénuj proměnnou tokenizer na textových datech.
  • Použij metodu .texts_to_sequences() na textová data.
  • Pomocí funkce to_categorical() připrav cílové indexy.