Attention personnelle ou attention portée sur plusieurs têtes
Vous êtes analyste de données au sein d'une équipe de développement de l'IA. Votre projet actuel consiste à comprendre et à mettre en œuvre les concepts d'auto-attention et d'attention multi-têtes dans un modèle de langage. Considérez les phrases suivantes tirées d'un ensemble de données de conversation.
A : "Le garçon est allé au magasin pour acheter des provisions.
B : "Oh, il était très excité à l'idée de recevoir ses céréales préférées."
C : "J'ai remarqué qu'il faisait beaucoup de gestes lorsqu'il en parlait.
Déterminez si ces phrases seraient mieux analysées en vous concentrant sur les relations au sein des données d'entrée (attention personnelle) ou en vous concentrant sur plusieurs aspects des données d'entrée simultanément (attention multiple).
Cet exercice fait partie du cours
Grands modèles linguistiques (LLMs) Concepts
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
