ComeçarComece de graça

Dissecando o Transformer

A arquitetura Transformer revolucionou a modelagem de sequências, integrando muitos avanços em deep learning, como codificação posicional, mecanismos de atenção e muito mais.


Qual componente da arquitetura Transformer é responsável por capturar informações sobre a posição de cada token na sequência?

Este exercício faz parte do curso

Modelos Transformer com PyTorch

Ver curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Começar o exercício