Prédiction de texte avec des LSTM

Dans les exercices suivants, vous allez construire un petit modèle LSTM capable de prédire le mot suivant à partir d’un petit jeu de données textuelles. Ce jeu de données est constitué de citations nettoyées des films The Lord of the Ring. Vous les trouverez dans la variable text.

Vous allez transformer ce text en sequences de longueur 4 et utiliser le Tokenizer de Keras pour préparer les variables explicatives et les étiquettes de votre modèle !

Le Tokenizer de Keras est déjà importé pour vous. Il attribue un numéro unique à chaque mot unique et stocke ces correspondances dans un dictionnaire. C’est important, car le modèle manipule des nombres, mais nous voudrons ensuite décoder les nombres de sortie en mots.

Cet exercice fait partie du cours

Introduction au Deep Learning avec Keras

Afficher le cours

Instructions

Divisez le texte en un tableau de mots avec .split().
Créez des phrases de 4 mots chacune, en avançant d’un mot à la fois.
Instanciez un Tokenizer(), puis ajustez-le sur les phrases avec .fit_on_texts().
Convertissez sentences en une séquence de nombres en appelant .texts_to_sequences().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Split text into an array of words 
words = ____.____

# Make sentences of 4 words each, moving one word at a time
sentences = []
for i in range(4, len(words)):
  sentences.append(' '.join(words[i-____:i]))

# Instantiate a Tokenizer, then fit it on the sentences
tokenizer = ____
tokenizer.____(____)

# Turn sentences into a sequence of numbers
sequences = tokenizer.____(____)
print("Sentences: \n {} \n Sequences: \n {}".format(sentences[:5],sequences[:5]))

Modifier et exécuter le code

Cet exercice fait partie du cours

Introduction au Deep Learning avec Keras

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Dans ce premier chapitre, vous serez initié aux réseaux de neurones : vous comprendrez quels types de problèmes ils peuvent résoudre et quand les utiliser. Vous construirez également plusieurs réseaux et sauverez la planète en entraînant un modèle de régression qui approxime l’orbite d’une météorite qui se rapproche de nous !

Exercise 1: Qu’est-ce que Keras ?Exercise 2: Décrire Keras Exercise 3: Utiliseriez-vous le deep learning ?Exercise 4: Votre premier réseau de neurones Exercise 5: Bonjour les réseaux !Exercise 6: Compter les paramètres Exercise 7: Reproduisez le modèle !Exercise 8: Survivre à l’impact d’une météorite Exercise 9: Spécifier un modèle Exercise 10: Entraînement Exercise 11: Prédire l’orbite !

À la fin de ce chapitre, vous saurez résoudre des problèmes binaires, multiclasse et multi-étiquettes avec des réseaux de neurones. Pour cela, vous vous attaquerez à des défis comme la détection de faux billets de dollars, l’identification de la personne qui a lancé une fléchette sur une cible, et la création d’un système intelligent pour arroser votre ferme. Vous saurez aussi tracer les métriques d’entraînement d’un modèle, arrêter l’entraînement et enregistrer vos modèles lorsqu’ils n’améliorent plus.

Exercise 1: Classification binaire Exercise 2: Explorer des billets de dollar Exercise 3: Un modèle de classification binaire Exercise 4: Ce billet d’un dollar est-il faux ?Exercise 5: Classification multi-classe Exercise 6: Un modèle multi-classes Exercise 7: Préparer votre jeu de données Exercise 8: Entraîner sur les lanceurs de fléchettes Exercise 9: Prédictions Softmax Exercise 10: Classification multi-étiquette Exercise 11: Une machine d’irrigation Exercise 12: Entraîner avec des étiquettes multiples Exercise 13: Callbacks Keras Exercise 14: Le callback d’historique Exercise 15: Arrêter précocement votre modèle Exercise 16: Une combinaison de callbacks

Dans les chapitres précédents, vous avez entraîné de nombreux modèles ! Vous allez maintenant apprendre à interpréter les courbes d’apprentissage pour comprendre vos modèles pendant l’entraînement. Vous visualiserez également les effets des fonctions d’activation, des tailles de lot et de la normalisation par lot. Enfin, vous verrez comment effectuer une optimisation automatique des hyperparamètres de vos modèles Keras avec sklearn.

Exercise 1: Courbes d’apprentissage Exercise 2: Apprendre les chiffres Exercise 3: Le modèle fait-il du surapprentissage ?Exercise 4: Avons-nous besoin de plus de données ?Exercise 5: Fonctions d’activation Exercise 6: Différentes fonctions d’activation Exercise 7: Comparer les fonctions d’activation Exercise 8: Comparer les fonctions d’activation II Exercise 9: Taille de lot et normalisation par lot Exercise 10: Modifier la taille des lots Exercise 11: Normalisation par lot d’un modèle familier Exercise 12: Effets de la normalisation par lot Exercise 13: Ajustement des hyperparamètres Exercise 14: Préparer un modèle pour l’optimisation Exercise 15: Ajuster les hyperparamètres du modèle Exercise 16: Entraîner avec validation croisée

Il est temps de découvrir des architectures plus avancées ! Vous créerez un autoencodeur pour reconstruire des images bruitées, visualiserez les activations d’un réseau de neurones convolutionnel, utiliserez des modèles profonds préentraînés pour classifier des images et en apprendrez davantage sur les réseaux récurrents et le traitement de texte en construisant un réseau qui prédit le mot suivant dans une phrase.

Exercise 1: Tenseurs, couches et autoencodeurs Exercise 2: Un flux de tenseurs Exercise 3: Séparation neuronale Exercise 4: Créer un autoencodeur Exercise 5: Débruitage comme un autoencodeur Exercise 6: Introduction aux CNN Exercise 7: Créer un modèle CNN Exercise 8: Observer les convolutions Exercise 9: Préparer votre image d’entrée Exercise 10: Utiliser un modèle du monde réel Exercise 11: Introduction aux LSTM Exercise 12: Prédiction de texte avec des LSTM

Exercice en cours

Exercise 13: Créez votre modèle LSTM Exercise 14: Décoder vos prédictions Exercise 15: Testez votre modèle !Exercise 16: Vous avez terminé !