Comprendre les vecteurs one-hot
Vous apprendrez ici à générer des vecteurs codés en one-hot à partir de mots. Le codage « one-hot » est une transformation couramment appliquée aux mots afin de les représenter sous forme numérique.
Vous utiliserez la fonction Keras « to_categorical()
» pour créer des vecteurs one-hot. La fonction to_categorical()
attend une séquence d'entiers en entrée. Par conséquent, un dictionnaire d'word2index
s est fourni et peut être utilisé pour convertir un mot en un nombre entier.
Pour réussir cet exercice, vous devrez également utiliser la fonction Python intégrée « zip()
». La fonction « zip()
» vous permet d'itérer plusieurs éléments à la fois. Par exemple, si vous avez deux listes xx
et yy
de même longueur, en appelant for x,y in zip(xx,yy)
, vous pouvez accéder de manière itérative à chaque élément x
et y
des listes.
Cet exercice fait partie du cours
Traduction automatique avec Keras
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
from tensorflow.keras.utils import to_categorical
# Create a list of words and convert them to indices
words = [____, ____, ____]
word_ids = [word2index[____] for w in ____]
print(____)