Exemple de NMT
Cet exercice reprend l’aperçu de NMT présenté au début du cours. Vous allez continuer à traduire de courtes phrases en portugais vers l’anglais.
Quelques phrases d’exemple sont disponibles dans la variable sentences et sont affichées dans la console.
Un modèle pré-entraîné est également disponible dans la variable model et vous utiliserez deux fonctions personnalisées pour simplifier certaines étapes :
encode_sequences(): convertit les textes en séquences d’index numériques et les complète (padding).translate_many(): utilise le modèle pré‑entraîné pour traduire une liste de phrases du portugais vers l’anglais. Vous coderez vous‑même cette fonction plus tard.
Pour plus de détails sur ces fonctions, utilisez help(). Le package pandas est chargé sous le nom pd.
Cet exercice fait partie du cours
Réseaux de neurones récurrents (RNN) pour la modélisation du langage avec Keras
Instructions
- Utilisez la fonction
encode_sequences()pour prétraiter les textes et enregistrez le résultat dans la variableX. - Traduisez
sentencesà l’aide de la fonctiontranslate_many()en passantXcomme paramètre. - Créez un
pd.DataFrame()avec les listes d’origine et traduites comme colonnes. - Affichez le data frame.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Transform text into sequence of indexes and pad
X = ____(sentences)
# Print the sequences of indexes
print(X)
# Translate the sentences
translated = translate_many(model, ____)
# Create pandas DataFrame with original and translated
df = pd.DataFrame({'Original': ____, 'Translated': ____})
# Print the DataFrame
print(____)