CommencerCommencez gratuitement

Comprendre les vecteurs one-hot

Vous apprendrez ici à générer des vecteurs codés en one-hot à partir de mots. Le codage « one-hot » est une transformation couramment appliquée aux mots afin de les représenter sous forme numérique.

Vous utiliserez la fonction Keras « to_categorical() » pour créer des vecteurs one-hot. La fonction to_categorical() attend une séquence d'entiers en entrée. Par conséquent, un dictionnaire d'word2index s est fourni et peut être utilisé pour convertir un mot en un nombre entier.

Pour réussir cet exercice, vous devrez également utiliser la fonction Python intégrée « zip() ». La fonction « zip() » vous permet d'itérer plusieurs éléments à la fois. Par exemple, si vous avez deux listes xx et yy de même longueur, en appelant for x,y in zip(xx,yy), vous pouvez accéder de manière itérative à chaque élément x et y des listes.

Cet exercice fait partie du cours

<cours>Traduction automatique avec Keras</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

from tensorflow.keras.utils import to_categorical

# Create a list of words and convert them to indices
words = [____, ____, ____]
word_ids = [word2index[____] for w in ____]
print(____)
Modifier et exécuter le code