Teil 2: Die Funktion „to_categorical()“ ausprobieren
In Teil 1 hast du die Funktion „ compute_onehot_length()
” implementiert, die beim Berechnen von One-Hot-Vektoren das Argument „ num_classes
” nicht verwendet hat.
Der Parameter „ num_classes
“ legt fest, wie lang die Vektoren sein sollen, die die Funktion „ to_categorical()
“ erzeugt. Du wirst sehen, dass in Situationen, in denen du zwei verschiedene Korpora (also Textsammlungen) mit unterschiedlichem Vokabular hast, das Nichtdefinieren von „ num_classes
“ zu One-Hot-Vektoren unterschiedlicher Länge führen kann.
Für diese Übung gibt's die Funktion „ compute_onehot_length()
” und das Wörterbuch „ word2index
”.
Diese Übung ist Teil des Kurses
Maschinelle Übersetzung mit Keras
Anleitung zur Übung
- Rufe
compute_onehot_length()
anwords_1
. - Rufe
compute_onehot_length()
anwords_2
. - Druck die Längen der One-Hot-Vektoren aus, die du für „
words_1
“ und „words_2
“ bekommen hast.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)
words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)
# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)