Deel 2: De functie to_categorical() verkennen

In deel 1 heb je de functie compute_onehot_length() geïmplementeerd, die het argument num_classes niet gebruikte bij het berekenen van one-hotvectoren.

Het argument num_classes bepaalt de lengte van de one-hotencoded vectoren die door de functie to_categorical() worden geproduceerd. Je zult zien dat als je twee verschillende corpora (dus verzamelingen teksten) met verschillende woordenschatten hebt, het weglaten van num_classes kan leiden tot one-hotvectoren met verschillende lengtes.

Voor deze oefening zijn de functie compute_onehot_length() en het woordenboek word2index al beschikbaar gesteld.

Deze oefening maakt deel uit van de cursus

Machine Translation met Keras

Bekijk cursus

Oefeninstructies

Roep compute_onehot_length() aan voor words_1.
Roep compute_onehot_length() aan voor words_2.
Print de lengtes van de one-hotvectoren die je voor words_1 en words_2 hebt verkregen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)

words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)

# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)

Code bewerken en uitvoeren