Analyse de sentiment
Dans la vidéo, vous avez découvert diverses applications des modèles sequence-to-sequence. Dans cet exercice, vous allez voir comment utiliser un modèle préentraîné pour l’analyse de sentiment.
Le modèle est préchargé dans l’environnement dans la variable model. Les variables du jeu de test tokenisé X_test et y_test, ainsi que les données textuelles originales prétraitées sentences issues d’IMDb, sont également disponibles. Vous apprendrez plus tard dans le cours à prétraiter les textes et à créer/entraîner le modèle avec Keras.
Vous allez utiliser le modèle préentraîné pour obtenir des prédictions de sentiment. Le modèle renvoie un nombre entre zéro et un représentant la probabilité qu’une phrase ait un sentiment positif. Vous allez donc définir une règle de décision pour classer la prédiction en positive ou négative.
Cet exercice fait partie du cours
Réseaux de neurones récurrents (RNN) pour la modélisation du langage avec Keras
Instructions
- Utilisez la méthode
.predict()pour faire des prédictions sur les données de test. - Si la prédiction est supérieure à
0.5, attribuez"positive", sinon"negative", et enregistrez le résultat dans la variablepred_sentiment. - Créez un
pd.DataFramecontenant le texte prétraité, la prédiction obtenue à l’étape précédente et leurs vraies valeurs contenues dans la variabley_test. - Affichez les premières lignes avec la méthode
.head().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Inspect the first sentence on `X_test`
print(X_test[0])
# Get the predicion for all the sentences
pred = model.predict(____)
# Transform the predition into positive (> 0.5) or negative (<= 0.5)
pred_sentiment = ["positive" if x>____ else "negative" for x in pred]
# Create a data frame with sentences, predictions and true values
result = pd.DataFrame({'sentence': sentences, 'y_pred': ____, 'y_true': y_test})
# Print the first lines of the data frame
print(result.____)