Prepara vectores de etiquetas
En el ejercicio del vídeo, has aprendido las diferencias entre la clasificación binaria y la clasificación multiclase. Has aprendido que hay algunas modificaciones que deben realizarse en el proceso de preparación de datos antes de entrenar los modelos.
En este ejercicio, prepararás un conjunto de datos sin procesar con etiquetas en forma de texto. Los datos se proporcionan en un archivo de texto sin formato ( pandas.DataFrame ) llamado df, con dos columnas: text con los datos de texto y label con los nombres de las etiquetas. Tu tarea consiste en realizar todas las transformaciones necesarias en las etiquetas: cambiar la cadena por un número y codificarla con codificación one-hot.
El módulo pandas como pd y la función to_categorical() de keras.utils.np_utils ya están cargados en el entorno y las primeras líneas del conjunto de datos se imprimen en la consola para que puedas verlas.
Este ejercicio forma parte del curso
Redes neuronales recurrentes (RNN) para el modelado del lenguaje con Keras
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Get the numerical ids of column label
numerical_ids = df.label.____
# Print initial shape
print(numerical_ids.____)