Préparer les vecteurs de labels
Dans la vidéo, vous avez découvert les différences entre la classification binaire et la classification multi-classes. Vous avez vu qu’il faut adapter légèrement la préparation des données avant d’entraîner les modèles.
Dans cet exercice, vous allez préparer un jeu de données brut dont les labels sont fournis sous forme de texte. Les données sont dans un pandas.DataFrame nommé df, avec deux colonnes : text pour le texte et label pour le nom du label. Votre tâche consiste à effectuer toutes les transformations nécessaires sur les labels : convertir les chaînes en nombres, puis appliquer un encodage one-hot.
Le module pandas sous l’alias pd et la fonction to_categorical() de keras.utils.np_utils sont déjà chargés dans l’environnement, et les premières lignes du jeu de données sont affichées dans la console pour référence.
Cet exercice fait partie du cours
Réseaux de neurones récurrents (RNN) pour la modélisation du langage avec Keras
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get the numerical ids of column label
numerical_ids = df.label.____
# Print initial shape
print(numerical_ids.____)