Première partie : Exploration de la fonction to_categorical()
Saviez-vous que dans la vie réelle, le vocabulaire utilisé peut devenir très vaste (par exemple, plus de cent mille mots) ?
Cet exercice est divisé en deux parties et vous apprendrez l'importance de définir l'argument d'num_classes
de la fonction to_categorical()
. Dans la partie 1, vous allez implémenter la fonction compute_onehot_length()
qui génère des vecteurs one-hot pour une liste de mots donnée et calcule la longueur de ces vecteurs.
La fonction d'to_categorical()
a déjà été importée.
Cet exercice fait partie du cours
Traduction automatique avec Keras
Instructions
- Créez des identifiants de mots à l'aide de
words
etword2index
danscompute_onehot_length()
. - Créez des vecteurs onehot à l'aide de la fonction
to_categorical()
en utilisant les identifiants des mots. - Renvoie la longueur d'un vecteur onehot unique à l'aide de la syntaxe d'
<array>.shape
. - Calculez et imprimez la longueur des vecteurs onehot à l'aide de
compute_onehot_length()
pour la liste de motsHe
,drank
,milk
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))