ComenzarEmpieza gratis

Desgranando el Transformer

La arquitectura Transformer ha revolucionado el modelado de secuencias, integrando muchos avances en deep learning, como el positional encoding, los mecanismos de atención y mucho más.


¿Qué componente de la arquitectura Transformer se encarga de capturar información sobre la posición de cada token en la secuencia?

Este ejercicio forma parte del curso

Modelos Transformer con PyTorch

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio