2.ª parte: Explorando la función to_categorical()

En la parte 1, implementaste la función « compute_onehot_length() », que no utilizaba el argumento « num_classes » al calcular vectores onehot.

El argumento « num_classes » controla la longitud de los vectores codificados como «one-hot» producidos por la función « to_categorical() ». Verás que, en situaciones en las que hay dos corpus diferentes (es decir, colecciones de textos) con vocabularios distintos, dejar sin definir el espacio de vocabulario ( num_classes ) puede dar lugar a vectores de longitud variable.

Para este ejercicio, se han proporcionado la función « compute_onehot_length() » y el diccionario « word2index ».

Este ejercicio forma parte del curso

Traducción automática con Keras

Ver curso

Instrucciones del ejercicio

Llama a compute_onehot_length() en words_1.
Llama a compute_onehot_length() en words_2.
Imprime las longitudes de los vectores one-hot obtenidos para words_1 y words_2.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

words_1 = ["I", "like", "cats", "We", "like", "dogs", "He", "hates", "rabbits"]
# Call compute_onehot_length on words_1
length_1 = ____(____, ____)

words_2 = ["I", "like", "cats", "We", "like", "dogs", "We", "like", "cats"]
# Call compute_onehot_length on words_2
length_2 = ____(____, ____)

# Print length_1 and length_2
print("length_1 =>", ____, " and length_2 => ", ____)

Editar y ejecutar código