1.ª parte: Explorando la función to_categorical()
¿Sabías que en los problemas del mundo real, el tamaño del vocabulario puede llegar a ser muy grande (por ejemplo, más de cien mil palabras)?
Este ejercicio se divide en dos partes y aprenderás la importancia de establecer el argumento « num_classes
» de la función « to_categorical()
». En la parte 1, implementarás la función compute_onehot_length()
que genera vectores one-hot para una lista de palabras dada y calcula la longitud de esos vectores.
La función to_categorical()
ya se ha importado.
Este ejercicio forma parte del curso
Traducción automática con Keras
Instrucciones del ejercicio
- Crea identificadores de palabras utilizando
words
yword2index
encompute_onehot_length()
. - Crea vectores onehot utilizando la función «
to_categorical()
» con los ID de las palabras. - Devuelve la longitud de un único vector onehot utilizando la sintaxis «
<array>.shape
». - Calcula e imprime la longitud de los vectores onehot utilizando
compute_onehot_length()
para la lista de palabrasHe
,drank
,milk
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
def compute_onehot_length(words, word2index):
# Create word IDs for words
word_ids = [____[w] for w in ____]
# Convert word IDs to onehot vectors
onehot = ____(____)
# Return the length of a single one-hot vector
return onehot.____[1]
word2index = {"He":0, "drank": 1, "milk": 2}
# Compute and print onehot length of a list of words
print(____([____,____,____], ____))