Deel 2: De functie to_categorical() verkennen
In deel 1 heb je de functie compute_onehot_length() geïmplementeerd, die het argument num_classes niet gebruikte bij het berekenen van one-hotvectoren.
Het argument num_classes bepaalt de lengte van de one-hotencoded vectoren die door de functie to_categorical() worden geproduceerd. Je zult zien dat als je twee verschillende corpora (dus verzamelingen teksten) met verschillende woordenschatten hebt, het weglaten van num_classes kan leiden tot one-hotvectoren met verschillende lengtes.
Voor deze oefening zijn de functie compute_onehot_length() en het woordenboek word2index al beschikbaar gesteld.
Deze oefening maakt deel uit van de cursus
Machine Translation met Keras
Oefeninstructies
- Roep
compute_onehot_length()aan voorwords_1. - Roep
compute_onehot_length()aan voorwords_2. - Print de lengtes van de one-hotvectoren die je voor
words_1enwords_2hebt verkregen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)
words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)
# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)