Clasificación de artículos periodísticos

En este ejercicio crearás un modelo de clasificación multiclase.

El conjunto de datos ya está cargado en el entorno como news_novel. Además, todo el preprocesamiento de los datos de entrenamiento ya está realizado y también está disponible en el entorno un modelo de entrenamiento denominado « tokenizer ».

Se preentrenó un modelo RNN con la siguiente arquitectura: se utilizó la capa « Embedding », una capa « LSTM » y la capa de salida « Dense », que esperaba tres clases: « sci.space », « alt.atheism » y « soc.religion.christian ». Los pesos de este modelo entrenado están disponibles en el archivo « classify_news_weights.h5 ».

Preprocesarás los datos nuevos y los evaluarás en un nuevo conjunto de datos news_novel.

Este ejercicio forma parte del curso

Redes neuronales recurrentes (RNN) para el modelado del lenguaje con Keras

Ver curso

Instrucciones del ejercicio

Transforma los datos presentes en news_novel.data utilizando el archivo tokenizer que has descargado.
Rellena las secuencias obtenidas de índices numéricos.
Transforma las etiquetas presentes en news_novel.target en una representación one-hot.
Evalúa el modelo utilizando el método ` .evaluate() ` e imprime la pérdida y la precisión obtenidas.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Change text for numerical ids and pad
X_novel = tokenizer.texts_to_sequences(____)
X_novel = pad_sequences(____, maxlen=400)

# One-hot encode the labels
Y_novel = to_categorical(____)

# Load the model pre-trained weights
model.load_weights('classify_news_weights.h5')

# Evaluate the model on the new dataset
loss, acc = model.____(X_novel, Y_novel, batch_size=64)

# Print the loss and accuracy obtained
print("Loss:\t{0}\nAccuracy:\t{1}".format(____, ____))

Editar y ejecutar código