CommencerCommencer gratuitement

Préparer les vecteurs d'étiquettes

Dans l'exercice vidéo, vous avez appris les différences entre la classification binaire et la classification multi-classes. Vous avez appris que certaines modifications doivent être apportées au processus de préparation des données avant de pouvoir entraîner les modèles.

Dans cet exercice, vous allez préparer un ensemble de données brutes avec des étiquettes sous forme de texte. pandas.DataFrame Les données sont fournies sous forme de fichier Excel intitulé « df », avec deux colonnes : « text » contenant les données textuelles et « label » contenant les noms des étiquettes. Votre tâche consiste à effectuer toutes les transformations nécessaires sur les étiquettes : convertir les chaînes en nombres et encoder en one-hot.

Le module pandas sous le nom pd et la fonction to_categorical() à partir de keras.utils.np_utils sont déjà chargés dans l'environnement et les premières lignes de l'ensemble de données sont affichées sur la console pour que vous puissiez les voir.

Cet exercice fait partie du cours

Réseaux neuronaux récurrents (RNN) pour la modélisation du langage avec Keras

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get the numerical ids of column label
numerical_ids = df.label.____

# Print initial shape
print(numerical_ids.____)
Modifier et exécuter le code