Prepare os vetores de etiqueta
No exercício em vídeo, você aprendeu as diferenças entre classificação binária e classificação multiclasse. Você aprendeu que tem algumas mudanças no processo de preparação dos dados que precisam ser feitas antes de treinar os modelos.
Neste exercício, você vai preparar um conjunto de dados brutos com rótulos em forma de texto. Os dados estão em um arquivo chamado “ pandas.DataFrame ”, que é df, com duas colunas: “ text ”, que tem os dados de texto, e “ label ”, que tem os nomes dos rótulos. A tua tarefa é fazer todas as transformações necessárias nas etiquetas: mudar a string para número e codificar como one-hot.
O módulo pandas como pd e a função to_categorical() de keras.utils.np_utils já estão carregados no ambiente e as primeiras linhas do conjunto de dados são impressas no console para você ver.
Este exercício faz parte do curso
Redes Neurais Recorrentes (RNNs) para Modelagem de Linguagem com Keras
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Get the numerical ids of column label
numerical_ids = df.label.____
# Print initial shape
print(numerical_ids.____)