Comece agoraComece grátis

Dissecando o Transformer

A arquitetura Transformer revolucionou a modelagem de sequências, integrando muitos avanços em deep learning, como codificação posicional, mecanismos de atenção e muito mais.


Qual componente da arquitetura Transformer é responsável por capturar informações sobre a posição de cada token na sequência?

Este exercicio faz parte do curso

Modelos Transformer com PyTorch

Ver curso

exercicio interativo prático

Transforme teoria em prática com um dos nossos exercicio interativos

Iniciar exercicio