Préparation du texte de sortie

Dans cet exercice, vous allez préparer les textes de sortie qui seront utilisés dans le modèle de traduction. Outre la transformation du texte en séquences d'index, il est également nécessaire de coder chaque index en one-hot.

Les textes en anglais sont chargés dans la variable « en_sentences », le tokenizer adapté dans la variable « output_tokenizer » et la taille du vocabulaire anglais dans « en_vocab_size ».

De plus, une fonction permettant d'effectuer les premières étapes de la transformation de la langue de sortie (transformation de textes en séquence d'index) a déjà été créée. La fonction est chargée dans l'environnement sous le nom « transform_text_to_sequences() » et comporte deux paramètres : « sentences », qui attend une liste de phrases en anglais, et « tokenizer », qui attend un objet « fitted Tokenizer » issu du module « keras.preprocessing.text ».

numpy est chargé en tant qu'np.

Cet exercice fait partie du cours

Réseaux neuronaux récurrents (RNN) pour la modélisation du langage avec Keras

Afficher le cours

Instructions

Transmettez les variables « en_sentences » et « output_tokenizer » à la fonction « transform_text_to_sequences() » afin d'initialiser la variable « Y ».
Utilisez la fonction « to_categorical() » pour encoder les phrases en « one-hot ». Veuillez utiliser la variable « en_vocab_size » comme nombre de classes.
Transformez la liste temporaire en tableau numpy et remodelez-la pour obtenir une forme identique à celle d'(num_sentences, sentences_len, en_vocab_size).
Veuillez imprimer le texte brut et le texte transformé.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Initialize the variable
Y = transform_text_to_sequences(____, ____)

# Temporary list
ylist = list()
for sequence in Y:
  	# One-hot encode sentence and append to list
    ylist.append(____(sequence, num_classes=____))

# Update the variable
Y = np.array(ylist).reshape(____, Y.shape[1], en_vocab_size)

# Print the raw sentence and its transformed version
print("Raw sentence: {0}\nTransformed: {1}".format(____, Y[0]))

Modifier et exécuter le code

Cet exercice fait partie du cours

Réseaux neuronaux récurrents (RNN) pour la modélisation du langage avec Keras

AvancéNiveau de compétence

4.8+

Commencer le cours gratuitement

Dans ce chapitre, vous apprendrez les bases des réseaux neuronaux récurrents (RNN). Nous commencerons par quelques prérequis, puis nous poursuivrons par la compréhension du flux d'informations à travers le réseau, avant de voir comment mettre en œuvre de tels modèles avec Keras dans le cadre d'une tâche de classification des sentiments.

Exercise 1: Présentation du cours Exercise 2: Comparaison du nombre de paramètres des réseaux neuronaux récurrents (RNN) et des réseaux neuronaux artificiels (ANN)Exercise 3: Analyse des sentiments Exercise 4: Modèles séquence à séquence Exercise 5: Introduction aux modèles linguistiques Exercise 6: S'habituer aux données textuelles Exercise 7: Préparation des données textuelles pour la saisie dans le modèle Exercise 8: Transformer un nouveau texte Exercise 9: Introduction aux RNN dans Keras Exercise 10: Modèles Keras Exercise 11: Prétraitement Keras Exercise 12: Votre premier modèle RNN

Vous découvrirez les problèmes de gradient disparu et explosif, qui surviennent souvent dans les RNN, et comment les résoudre à l'aide des cellules GRU et LSTM. De plus, vous créerez des couches d'intégration pour les modèles linguistiques et vous vous pencherez à nouveau sur la tâche de classification des sentiments.

Exercise 1: Gradients qui disparaissent et explosent Exercise 2: Problème de gradient explosif Exercise 3: Problème de gradient décroissant Exercise 4: Cellules GRU et LSTM Exercise 5: Les cellules GRU sont plus performantes que les RNN simples.Exercise 6: Empilement de couches RNN Exercise 7: La couche d'intégration Exercise 8: Comparaison du nombre de paramètres Exercise 9: Apprentissage par transfert Exercise 10: Les intégrations améliorent les performances.Exercise 11: Revisiter la classification des sentiments Exercise 12: Meilleure classification des sentiments Exercise 13: Utilisation de la couche CNN

Dans la suite de ce chapitre, vous apprendrez comment préparer les données pour la tâche de classification multi-classes, ainsi que les différences entre la classification multi-classes et la classification binaire (analyse des sentiments). Enfin, vous apprendrez à créer des modèles et à mesurer leurs performances avec Keras.

Exercise 1: Pré-traitement des données Exercise 2: Préparer les vecteurs d'étiquettes Exercise 3: Pré-traiter les données Exercise 4: Apprentissage par transfert pour les modèles linguistiques Exercise 5: Point de départ de l'apprentissage par transfert Exercise 6: Word2Vec Exercise 7: Modèles de classification multicatégorie Exercise 8: Exploration de l'ensemble de données 20 News Groups Exercise 9: Classification des articles d'actualité Exercise 10: Évaluation des performances du modèle Exercise 11: Compromis entre précision et rappel Exercise 12: Précision ou rappel, telle est la question Exercise 13: Performances en classification multi-classes

Ce chapitre présente deux applications des modèles RNN : Génération de texte et traduction automatique neuronale. Vous apprendrez à préparer les données textuelles au format requis par les modèles. Le modèle Text Generation est utilisé pour reproduire la façon de parler d'un personnage et s'amusera à imiter Sheldon de la série The Big Bang Theory. La traduction automatique neuronale est utilisée, par exemple, par Google Translate dans un modèle beaucoup plus complexe. Dans ce chapitre, vous allez créer un modèle qui traduit de petites phrases portugaises en anglais.

Exercise 1: Modèles séquence à séquence Exercise 2: Exemples de génération de texte Exercise 3: Exemple de NMT Exercise 4: La fonction de génération de texte Exercise 5: Prédire le caractère suivant Exercise 6: Générer une phrase avec contexte Exercise 7: Modifier l'échelle de probabilité Exercise 8: Modèles de génération de texte Exercise 9: Créer des vecteurs de phrases et de caractères suivants Exercise 10: Préparation des données pour la formation Exercise 11: Création du modèle de génération de texte Exercise 12: Traduction automatique neuronale Exercise 13: Préparation du texte à saisir Exercise 14: Préparation du texte de sortie

Exercice en cours

Exercise 15: Traduire du portugais vers l'anglais Exercise 16: Félicitations !