1. Learn
  2. /
  3. Kurser
  4. /
  5. Modele Transformer w PyTorch

Connected

övning

Projektowanie maski dla mechanizmu samo-uwagi

Aby dekoder mógł uczyć się przewidywania tokenów, ważne jest maskowanie przyszłych tokenów podczas przetwarzania sekwencji wejściowych. Zbudujesz maskę w postaci macierzy trójkątnej złożonej z wartości True i False, gdzie wartości False w górnej przekątnej wykluczają przyszłe tokeny.

Instruktioner

100 XP
  • Utwórz macierz logiczną tgt_mark, która maskuje przyszłe tokeny w mechanizmie uwagi ciała dekodera.