Parte 1: Explorando a função to_categorical()
Você sabia que, nos problemas do mundo real, o tamanho do vocabulário pode ficar bem grande (por exemplo, mais de cem mil palavras)?
Esse exercício é dividido em duas partes e você vai aprender a importância de definir o argumento “ num_classes
” da função “ to_categorical()
”. Na parte 1, você vai implementar a função compute_onehot_length()
que gera vetores one-hot para uma lista de palavras e calcula o comprimento desses vetores.
A função to_categorical()
já foi importada.
Este exercício faz parte do curso
Tradução automática com Keras
Instruções do exercício
- Crie IDs de palavras usando
words
eword2index
emcompute_onehot_length()
. - Crie vetores onehot usando a função “
to_categorical()
” com os IDs das palavras. - Retorna o comprimento de um único vetor onehot usando a sintaxe
<array>.shape
. - Calcule e imprima o comprimento dos vetores onehot usando
compute_onehot_length()
para a lista de palavrasHe
,drank
,milk
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))