Deuxième partie : Exploration de la fonction to_categorical()

Dans la partie 1, vous avez implémenté la fonction compute_onehot_length() qui n'utilisait pas l'argument num_classes lors du calcul des vecteurs onehot.

L'argument « num_classes » contrôle la longueur des vecteurs codés en «one-hot» générés par la fonction « to_categorical() ». Vous constaterez que lorsque vous disposez de deux corpus (c'est-à-dire deux collections de textes) avec des vocabulaires différents, le fait de ne pas définir l'num_classes peut entraîner des vecteurs one-hot de longueur variable.

Pour cet exercice, la fonction compute_onehot_length() et le dictionnaire word2index ont été fournis.

Cet exercice fait partie du cours

Traduction automatique avec Keras

Afficher le cours

Instructions

Appelez compute_onehot_length() sur words_1.
Appelez compute_onehot_length() sur words_2.
Veuillez imprimer les longueurs des vecteurs one-hot obtenus pour words_1 et words_2.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)

words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)

# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)

Modifier et exécuter le code