Dissecando o Transformer
A arquitetura Transformer revolucionou a modelagem de sequências, integrando muitos avanços em deep learning, como codificação posicional, mecanismos de atenção e muito mais.
Qual componente da arquitetura Transformer é responsável por capturar informações sobre a posição de cada token na sequência?
Este exercicio faz parte do curso
Modelos Transformer com PyTorch
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio