Prepara vectores de etiquetas

En el ejercicio del vídeo, has aprendido las diferencias entre la clasificación binaria y la clasificación multiclase. Has aprendido que hay algunas modificaciones que deben realizarse en el proceso de preparación de datos antes de entrenar los modelos.

En este ejercicio, prepararás un conjunto de datos sin procesar con etiquetas en forma de texto. Los datos se proporcionan en un archivo de texto sin formato ( pandas.DataFrame ) llamado df, con dos columnas: text con los datos de texto y label con los nombres de las etiquetas. Tu tarea consiste en realizar todas las transformaciones necesarias en las etiquetas: cambiar la cadena por un número y codificarla con codificación one-hot.

El módulo pandas como pd y la función to_categorical() de keras.utils.np_utils ya están cargados en el entorno y las primeras líneas del conjunto de datos se imprimen en la consola para que puedas verlas.

Este ejercicio forma parte del curso

Redes neuronales recurrentes (RNN) para el modelado del lenguaje con Keras

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Get the numerical ids of column label
numerical_ids = df.label.____

# Print initial shape
print(numerical_ids.____)

Editar y ejecutar código