1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Transformer Models with PyTorch

Connected

cvičení

Přidání křížové pozornosti do vrstvy dekodéru

Aby bylo možné propojit enkodérové a dekodérové bloky, které jsi definoval/a dříve, do enkodér-dekodérového transformeru, je potřeba vytvořit mechanismus křížové pozornosti, který bude sloužit jako most mezi oběma částmi.

Třída MultiHeadAttention, kterou jsi definoval/a dříve, je stále k dispozici.

Pokyny

100 XP
  • V metodě __init__ definuj mechanismus křížové pozornosti (pomocí MultiHeadAttention) a třetí normalizaci vrstvy (pomocí nn.LayerNorm).
  • Dokonči dopředný průchod tak, aby zahrnoval křížovou pozornost ve vrstvě dekodéru.