1. Learn
  2. /
  3. 课程
  4. /
  5. Uczenie głębokie dla tekstu z PyTorch

Connected

道练习

Trenowanie i testowanie modelu RNN z mechanizmem atencji

Zespół PyBooks zbudował wcześniej model RNN do przewidywania słów – bez mechanizmu atencji. Ten wyjściowy model, określany jako rnn_model, został już wytrenowany i jego instancja jest wstępnie załadowana. Twoim zadaniem jest teraz wytrenowanie nowego modelu RNNWithAttentionModel i porównanie jego predykcji z wynikami wcześniejszego rnn_model.

Następujące elementy są wstępnie załadowane:

  • inputs: lista sekwencji wejściowych jako tensory
  • targets: tensor zawierający docelowe słowa dla każdej sekwencji wejściowej
  • optimizer: funkcja optymalizatora Adam
  • criterion: funkcja CrossEntropyLoss
  • pad_sequences: funkcja do dopełniania sekwencji wejściowych na potrzeby grupowania wsadowego
  • attention_model: klasa modelu zdefiniowana w poprzednim ćwiczeniu
  • rnn_model: wytrenowany model RNN przygotowany przez zespół PyBooks

说明

100 XP
  • Przestaw model RNN w tryb ewaluacji przed przetestowaniem go na danych testowych.
  • Uzyskaj wynik modelu RNN, przekazując odpowiednie dane wejściowe do tego modelu.
  • Wyodrębnij słowo z najwyższym wynikiem predykcji z wyjścia modelu RNN.
  • Podobnie dla modelu z atencją wyodrębnij słowo z najwyższym wynikiem predykcji z wyjścia tego modelu.