One-Hot-Vektoren verstehen
Hier lernst du, wie du aus Wörtern One-Hot-codierte Vektoren erstellst. One-Hot-Kodierung ist eine gängige Methode, um Wörter numerisch darzustellen.
Du wirst die Keras-Funktion „ to_categorical()
“ verwenden, um One-Hot-Vektoren zu erstellen. Die Funktion „ to_categorical()
“ braucht als Eingabe eine Folge von ganzen Zahlen. Deshalb gibt's ein Wörterbuch namens „ word2index
“, mit dem man Wörter in ganze Zahlen umwandeln kann.
Um diese Übung erfolgreich abzuschließen, musst du auch die integrierte Python-Funktion „ zip()
“ verwenden. Mit der Funktion „ zip()
“ kannst du mehrere Sachen gleichzeitig durchlaufen. Wenn du zum Beispiel zwei Listen xx
und yy
mit derselben Länge hast, kannst du durch Aufrufen von for x,y in zip(xx,yy)
iterativ auf jedes Element x
und y
der Listen zugreifen.
Diese Übung ist Teil des Kurses
Maschinelle Übersetzung mit Keras
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
from tensorflow.keras.utils import to_categorical
# Create a list of words and convert them to indices
words = [____, ____, ____]
word_ids = [word2index[____] for w in ____]
print(____)