Desgranando el Transformer
La arquitectura Transformer ha revolucionado el modelado de secuencias, integrando muchos avances en deep learning, como el positional encoding, los mecanismos de atención y mucho más.
¿Qué componente de la arquitectura Transformer se encarga de capturar información sobre la posición de cada token en la secuencia?
Este ejercicio forma parte del curso
Modelos Transformer con PyTorch
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio