Analyse de sentiment

Dans la vidéo, vous avez découvert diverses applications des modèles sequence-to-sequence. Dans cet exercice, vous allez voir comment utiliser un modèle préentraîné pour l’analyse de sentiment.

Le modèle est préchargé dans l’environnement dans la variable model. Les variables du jeu de test tokenisé X_test et y_test, ainsi que les données textuelles originales prétraitées sentences issues d’IMDb, sont également disponibles. Vous apprendrez plus tard dans le cours à prétraiter les textes et à créer/entraîner le modèle avec Keras.

Vous allez utiliser le modèle préentraîné pour obtenir des prédictions de sentiment. Le modèle renvoie un nombre entre zéro et un représentant la probabilité qu’une phrase ait un sentiment positif. Vous allez donc définir une règle de décision pour classer la prédiction en positive ou négative.

Cet exercice fait partie du cours

<cours>Réseaux de neurones récurrents (RNN) pour la modélisation du langage avec Keras</cours>

Voir le cours

Instructions de l’exercice

Utilisez la méthode .predict() pour faire des prédictions sur les données de test.
Si la prédiction est supérieure à 0.5, attribuez "positive", sinon "negative", et enregistrez le résultat dans la variable pred_sentiment.
Créez un pd.DataFrame contenant le texte prétraité, la prédiction obtenue à l’étape précédente et leurs vraies valeurs contenues dans la variable y_test.
Affichez les premières lignes avec la méthode .head().

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Inspect the first sentence on `X_test`
print(X_test[0])

# Get the predicion for all the sentences
pred = model.predict(____)

# Transform the predition into positive (> 0.5) or negative (<= 0.5)
pred_sentiment = ["positive" if x>____ else "negative" for x in pred]

# Create a data frame with sentences, predictions and true values
result = pd.DataFrame({'sentence': sentences, 'y_pred': ____, 'y_true': y_test})

# Print the first lines of the data frame
print(result.____)

Modifier et exécuter le code