Entendendo vetores one-hot
Aqui você vai aprender a criar vetores codificados one-hot a partir de palavras. A codificação one-hot é uma transformação comum aplicada a palavras para representá-las numericamente.
Você vai usar a função Keras to_categorical()
pra criar vetores one-hot. A função to_categorical()
espera uma sequência de números inteiros como entrada. Por isso, tem um dicionário word2index
que dá pra usar pra transformar uma palavra em um número inteiro.
Para terminar esse exercício, você também vai precisar usar a função Python embutida zip()
. A função “ zip()
” permite que você repita várias coisas de uma vez só. Por exemplo, se você tem duas listas xx
e yy
com o mesmo tamanho, chamando for x,y in zip(xx,yy)
você pode acessar cada elemento x
e y
das listas de forma iterativa.
Este exercício faz parte do curso
Tradução automática com Keras
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from tensorflow.keras.utils import to_categorical
# Create a list of words and convert them to indices
words = [____, ____, ____]
word_ids = [word2index[____] for w in ____]
print(____)