Clasificación de artículos periodísticos
En este ejercicio crearás un modelo de clasificación multiclase.
El conjunto de datos ya está cargado en el entorno como news_novel. Además, todo el preprocesamiento de los datos de entrenamiento ya está realizado y también está disponible en el entorno un modelo de entrenamiento denominado « tokenizer ».
Se preentrenó un modelo RNN con la siguiente arquitectura: se utilizó la capa « Embedding », una capa « LSTM » y la capa de salida « Dense », que esperaba tres clases: « sci.space », « alt.atheism » y « soc.religion.christian ». Los pesos de este modelo entrenado están disponibles en el archivo « classify_news_weights.h5 ».
Preprocesarás los datos nuevos y los evaluarás en un nuevo conjunto de datos news_novel.
Este ejercicio forma parte del curso
Redes neuronales recurrentes (RNN) para el modelado del lenguaje con Keras
Instrucciones del ejercicio
- Transforma los datos presentes en
news_novel.datautilizando el archivotokenizerque has descargado. - Rellena las secuencias obtenidas de índices numéricos.
- Transforma las etiquetas presentes en
news_novel.targeten una representación one-hot. - Evalúa el modelo utilizando el método `
.evaluate()` e imprime la pérdida y la precisión obtenidas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Change text for numerical ids and pad
X_novel = tokenizer.texts_to_sequences(____)
X_novel = pad_sequences(____, maxlen=400)
# One-hot encode the labels
Y_novel = to_categorical(____)
# Load the model pre-trained weights
model.load_weights('classify_news_weights.h5')
# Evaluate the model on the new dataset
loss, acc = model.____(X_novel, Y_novel, batch_size=64)
# Print the loss and accuracy obtained
print("Loss:\t{0}\nAccuracy:\t{1}".format(____, ____))