N-grammes d’ordre supérieur pour l’analyse de sentiment
Comme dans un exercice précédent, nous allons construire un classificateur capable de détecter si la critique d’un film est positive ou négative. Mais cette fois, nous utiliserons des n-grammes jusqu’à n=2 pour cette tâche.
Les critiques d’entraînement avec n-grammes sont disponibles sous X_train_ng. Les critiques de test correspondantes sont disponibles sous X_test_ng. Enfin, utilisez y_train et y_test pour accéder respectivement aux classes de sentiment d’entraînement et de test.
Cet exercice fait partie du cours
Feature Engineering pour le NLP en Python
Instructions
- Définissez une instance de MultinomialNB. Nommez-la
clf_ng. - Entraînez le classificateur sur
X_train_ngety_train. - Mesurez l’
accuracysurX_test_ngety_testà l’aide de la méthodescore().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Define an instance of MultinomialNB
clf_ng = ____
# Fit the classifier
clf_ng.____(____, ____)
# Measure the accuracy
accuracy = ____
print("The accuracy of the classifier on the test set is %.3f" % accuracy)
# Predict the sentiment of a negative review
review = "The movie was not good. The plot had several holes and the acting lacked panache."
prediction = clf_ng.predict(ng_vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))