Vytvoření pozičních kódování

Embedding tokenů je dobrý začátek, ale těmto embeddingům stále chybí informace o pozici každého tokenu v sekvenci. Transformer architektura to řeší pomocí pozičních kódování, která do embeddingů zakódují informaci o pozici každého tokenu.

Vytvoříš třídu PositionalEncoding s následujícími parametry:

d_model: dimenzionalita vstupních embeddingů
max_seq_length: maximální délka sekvence (nebo délka sekvence, pokud jsou všechny sekvence stejně dlouhé)

Vytvoř matici nul o rozměrech max_seq_length krát d_model.
Proveď výpočty sinu a kosinu nad position * div_term a získej sudé a liché hodnoty pozičního embeddingu.
Zajisti, aby pe nebyl trénovatelným parametrem během trénování.
Přičti transformované poziční embeddingy ke vstupním embeddingům tokenů x.

cvičení

Vytvoření pozičních kódování

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení