Dissecando o Transformer
A arquitetura Transformer revolucionou a modelagem de sequências, integrando muitos avanços em deep learning, como codificação posicional, mecanismos de atenção e muito mais.
Qual componente da arquitetura Transformer é responsável por capturar informações sobre a posição de cada token na sequência?
Este exercício faz parte do curso
Modelos Transformer com PyTorch
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício