Teil 1: Die Funktion „to_categorical()“ ausprobieren
Wusstest du, dass in echten Problemen der Wortschatz echt groß werden kann (z. B. mehr als hunderttausend Wörter)?
Diese Übung ist in zwei Teile aufgeteilt, und du lernst, wie wichtig es ist, den Parameter „ num_classes
“ der Funktion „ to_categorical()
“ richtig einzustellen. In Teil 1 wirst du die Funktion „ compute_onehot_length()
” implementieren, die One-Hot-Vektoren für eine bestimmte Liste von Wörtern erzeugt und die Länge dieser Vektoren berechnet.
Die Funktion „ to_categorical()
“ wurde schon importiert.
Diese Übung ist Teil des Kurses
Maschinelle Übersetzung mit Keras
Anleitung zur Übung
- Erstell Wort-IDs mit „
words
“ und „word2index
“ in „compute_onehot_length()
“. - Erstell One-Hot-Vektoren mit der Funktion „
to_categorical()
” und den Wort-IDs. - Gibt die Länge eines einzelnen One-Hot-Vektors mit der Syntax „
<array>.shape
“ zurück. - Berechne und drucke die Länge von One-Hot-Vektoren mit „
compute_onehot_length()
” für die Liste der Wörter „He
”, „drank
” und „milk
”.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))