Implementacja wielogłowicowej atencji

Zanim zaczniesz budować własną klasę MultiHeadAttention, najpierw sprawdź, jak działa gotowa implementacja – przekonaj się, w jaki sposób przekształca ona macierze zapytań (query), kluczy (key) i wartości (value). Pamiętaj, że macierze te powstają przez rzutowanie osadzeń wejściowych za pomocą transformacji liniowych z wyuczonymi wagami.

Macierze query, key i value zostały już dla ciebie przygotowane, a klasa MultiHeadAttention jest już zdefiniowana.