Warstwa enkodera transformera

Mając zdefiniowaną klasę FeedForwardSubLayer, dysponujesz już wszystkimi elementami potrzebnymi do zdefiniowania klasy EncoderLayer. Przypomnij sobie, że warstwa enkodera składa się zazwyczaj z mechanizmu uwagi wielogłowicowej (multi-head attention) oraz podwarstwy feed-forward, z normalizacją warstwy i dropoutem stosowanymi na wejściu i wyjściu tej podwarstwy.

Klasy, które już wcześniej zdefiniowano, są dostępne pod tymi samymi nazwami, razem z torch i torch.nn zaimportowanym jako nn.

Uzupełnij metodę __init__, tworząc instancje MultiHeadAttention, FeedForwardSubLayer oraz dwóch warstw normalizacji.
Uzupełnij metodę forward(), dodając mechanizm uwagi wielogłowicowej i podwarstwę feed-forward; w mechanizmie uwagi użyj podanego src_mask oraz osadzeń wejściowych x jako macierzy query, key i value.

ćwiczenie

Warstwa enkodera transformera

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie