Parte 1: Explorando a função to_categorical()

Você sabia que, em problemas do mundo real, o tamanho do vocabulário pode ficar muito grande (por exemplo, mais de cem mil)?

Este exercício está dividido em duas partes, e você vai aprender a importância de definir o argumento num_classes da função to_categorical(). Na parte 1, você vai implementar a função compute_onehot_length() que gera vetores one-hot para uma lista de palavras e calcula o comprimento desses vetores.

A função to_categorical() já foi importada.

Este exercício faz parte do curso

Machine Translation with Keras

Ver curso

Instruções do exercício

Crie IDs de palavras usando words e word2index em compute_onehot_length().
Crie vetores one-hot usando a função to_categorical() a partir dos IDs de palavras.
Retorne o comprimento de um único vetor one-hot usando a sintaxe <array>.shape.
Calcule e imprima o comprimento dos vetores one-hot usando compute_onehot_length() para a lista de palavras He, drank, milk.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

def compute_onehot_length(words, word2index):
  # Create word IDs for words
  word_ids = [____[w] for w in ____]
  # Convert word IDs to onehot vectors
  onehot = ____(____)
  # Return the length of a single one-hot vector
  return onehot.____[1]

word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))

Editar e executar o código