Self-attention vs. multi-head attention
Eres analista de datos en un equipo de desarrollo de IA. Tu proyecto actual consiste en comprender e implementar los conceptos de self-attention y multi-head attention en un modelo de lenguaje. Considera las siguientes frases de un conjunto de datos de conversaciones.
Usa la aplicación interactiva para explorar la diferencia entre la self-attention (relaciones entre palabras específicas dentro del texto) y la multi-head attention (procesamiento simultáneo de múltiples aspectos del texto).
¿Qué tareas de análisis son ejemplos de self-attention frente a multi-head attention?
Este ejercicio forma parte del curso
Conceptos de grandes modelos lingüísticos (LLM)
ejercicio interactivo práctico
Convierte la teoría en práctica con uno de nuestros ejercicios interactivos
Empezar ejercicio