Auto-attention vs. attention multi-tête
Vous êtes analyste de données dans une équipe de développement en IA. Votre projet actuel consiste à comprendre et à implémenter les concepts d'auto-attention et d'attention multi-tête dans un modèle de langage. Considérez les phrases suivantes issues d'un jeu de données de conversations.
Utilisez l'application interactive pour explorer la différence entre l'auto-attention (relations entre des mots précis dans un texte) et l'attention multi-tête (traitement simultané de plusieurs aspects d'un texte).
Quelles tâches d'analyse relèvent de l'auto-attention et lesquelles de l'attention multi-tête ?
Cet exercice fait partie du cours
<cours>Concepts des grands modèles de langage (LLM)</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice