Parte 1: Explorando a função to_categorical()
Você sabia que, em problemas do mundo real, o tamanho do vocabulário pode ficar muito grande (por exemplo, mais de cem mil)?
Este exercício está dividido em duas partes, e você vai aprender a importância de definir o argumento num_classes da função to_categorical(). Na parte 1, você vai implementar a função compute_onehot_length() que gera vetores one-hot para uma lista de palavras e calcula o comprimento desses vetores.
A função to_categorical() já foi importada.
Este exercício faz parte do curso
Machine Translation with Keras
Instruções do exercício
- Crie IDs de palavras usando
wordseword2indexemcompute_onehot_length(). - Crie vetores one-hot usando a função
to_categorical()a partir dos IDs de palavras. - Retorne o comprimento de um único vetor one-hot usando a sintaxe
<array>.shape. - Calcule e imprima o comprimento dos vetores one-hot usando
compute_onehot_length()para a lista de palavrasHe,drank,milk.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))