2.ª parte: Explorando la función to_categorical()
En la parte 1, implementaste la función « compute_onehot_length()
», que no utilizaba el argumento « num_classes
» al calcular vectores onehot.
El argumento « num_classes
» controla la longitud de los vectores codificados como «one-hot» producidos por la función « to_categorical()
». Verás que, en situaciones en las que hay dos corpus diferentes (es decir, colecciones de textos) con vocabularios distintos, dejar sin definir el espacio de vocabulario ( num_classes
) puede dar lugar a vectores de longitud variable.
Para este ejercicio, se han proporcionado la función « compute_onehot_length()
» y el diccionario « word2index
».
Este ejercicio forma parte del curso
Traducción automática con Keras
Instrucciones del ejercicio
- Llama a
compute_onehot_length()
enwords_1
. - Llama a
compute_onehot_length()
enwords_2
. - Imprime las longitudes de los vectores one-hot obtenidos para
words_1
ywords_2
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)
words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)
# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)