Deel 1: De functie to_categorical() verkennen
Wist je dat in realistische problemen de woordenschat heel groot kan worden (bijv. meer dan honderdduizend)?
Deze oefening bestaat uit twee delen en je leert waarom het belangrijk is om het argument num_classes van de functie to_categorical() in te stellen. In deel 1 implementeer je de functie compute_onehot_length() die one-hotvectoren genereert voor een gegeven lijst met woorden en de lengte van die vectoren berekent.
De functie to_categorical() is al geïmporteerd.
Deze oefening maakt deel uit van de cursus
Machine Translation met Keras
Oefeninstructies
- Maak woord-ID's met
wordsenword2indexincompute_onehot_length(). - Maak onehot-vectoren met de functie
to_categorical()op basis van de woord-ID's. - Geef de lengte terug van één onehot-vector met de syntaxis
<array>.shape. - Bereken en print de lengte van onehot-vectoren met
compute_onehot_length()voor de lijst woordenHe,drank,milk.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))