Aan de slagGa gratis aan de slag

Deel 1: De functie to_categorical() verkennen

Wist je dat in realistische problemen de woordenschat heel groot kan worden (bijv. meer dan honderdduizend)?

Deze oefening bestaat uit twee delen en je leert waarom het belangrijk is om het argument num_classes van de functie to_categorical() in te stellen. In deel 1 implementeer je de functie compute_onehot_length() die one-hotvectoren genereert voor een gegeven lijst met woorden en de lengte van die vectoren berekent.

De functie to_categorical() is al geïmporteerd.

Deze oefening maakt deel uit van de cursus

Machine Translation met Keras

Cursus bekijken

Oefeninstructies

  • Maak woord-ID's met words en word2index in compute_onehot_length().
  • Maak onehot-vectoren met de functie to_categorical() op basis van de woord-ID's.
  • Geef de lengte terug van één onehot-vector met de syntaxis <array>.shape.
  • Bereken en print de lengte van onehot-vectoren met compute_onehot_length() voor de lijst woorden He, drank, milk.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

def compute_onehot_length(words, word2index):
  # Create word IDs for words
  word_ids = [____[w] for w in ____]
  # Convert word IDs to onehot vectors
  onehot = ____(____)
  # Return the length of a single one-hot vector
  return onehot.____[1]

word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))
Code bewerken en uitvoeren