Trenowanie i testowanie modelu RNN z mechanizmem atencji

Zespół PyBooks zbudował wcześniej model RNN do przewidywania słów – bez mechanizmu atencji. Ten wyjściowy model, określany jako rnn_model, został już wytrenowany i jego instancja jest wstępnie załadowana. Twoim zadaniem jest teraz wytrenowanie nowego modelu RNNWithAttentionModel i porównanie jego predykcji z wynikami wcześniejszego rnn_model.

Następujące elementy są wstępnie załadowane:

inputs: lista sekwencji wejściowych jako tensory
targets: tensor zawierający docelowe słowa dla każdej sekwencji wejściowej
optimizer: funkcja optymalizatora Adam
criterion: funkcja CrossEntropyLoss
pad_sequences: funkcja do dopełniania sekwencji wejściowych na potrzeby grupowania wsadowego
attention_model: klasa modelu zdefiniowana w poprzednim ćwiczeniu
rnn_model: wytrenowany model RNN przygotowany przez zespół PyBooks

Przestaw model RNN w tryb ewaluacji przed przetestowaniem go na danych testowych.
Uzyskaj wynik modelu RNN, przekazując odpowiednie dane wejściowe do tego modelu.
Wyodrębnij słowo z najwyższym wynikiem predykcji z wyjścia modelu RNN.
Podobnie dla modelu z atencją wyodrębnij słowo z najwyższym wynikiem predykcji z wyjścia tego modelu.

道练习

Trenowanie i testowanie modelu RNN z mechanizmem atencji

说明

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}道练习

说明

道练习