One-hotvectoren begrijpen
Hier leer je one-hot gecodeerde vectoren te genereren uit woorden. One-hot encoding is een veelgebruikte transformatie om woorden numeriek weer te geven.
Je gebruikt de Keras-functie to_categorical() om one-hotvectoren te maken. De functie to_categorical() verwacht een reeks gehele getallen als invoer. Daarom is er een word2index-dictionary beschikbaar waarmee je een woord naar een geheel getal kunt omzetten.
Om deze oefening succesvol af te ronden, moet je ook de ingebouwde Python-functie zip() gebruiken. Met de functie zip() kun je meerdere dingen tegelijk doorlopen. Als je bijvoorbeeld twee lijsten xx en yy met dezelfde lengte hebt, kun je met for x,y in zip(xx,yy) elk x- en y-element van de lijsten iteratief benaderen.
Deze oefening maakt deel uit van de cursus
Machine Translation met Keras
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from tensorflow.keras.utils import to_categorical
# Create a list of words and convert them to indices
words = [____, ____, ____]
word_ids = [word2index[____] for w in ____]
print(____)