1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Transformer Models with PyTorch

Connected

cvičení

Návrh masky pro self-attention

Aby se decoder naučil správně předpovídat tokeny, je důležité při zpracování vstupních sekvencí maskovat budoucí tokeny. Sestavíš masku v podobě trojúhelníkové matice hodnot True a False, přičemž hodnoty False v horní diagonále zajistí, že budoucí tokeny budou vyloučeny.

Pokyny

100 XP
  • Vytvoř booleovskou matici tgt_mark pro maskování budoucích tokenů v attention mechanismu těla decoderu.