Deuxième partie : Exploration de la fonction to_categorical()
Dans la partie 1, vous avez implémenté la fonction compute_onehot_length()
qui n'utilisait pas l'argument num_classes
lors du calcul des vecteurs onehot.
L'argument « num_classes
» contrôle la longueur des vecteurs codés en «one-hot» générés par la fonction « to_categorical()
». Vous constaterez que lorsque vous disposez de deux corpus (c'est-à-dire deux collections de textes) avec des vocabulaires différents, le fait de ne pas définir l'num_classes
peut entraîner des vecteurs one-hot de longueur variable.
Pour cet exercice, la fonction compute_onehot_length()
et le dictionnaire word2index
ont été fournis.
Cet exercice fait partie du cours
Traduction automatique avec Keras
Instructions
- Appelez
compute_onehot_length()
surwords_1
. - Appelez
compute_onehot_length()
surwords_2
. - Veuillez imprimer les longueurs des vecteurs one-hot obtenus pour
words_1
etwords_2
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)
words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)
# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)