N-grammes d’ordre supérieur pour l’analyse de sentiment

Comme dans un exercice précédent, nous allons construire un classificateur capable de détecter si la critique d’un film est positive ou négative. Mais cette fois, nous utiliserons des n-grammes jusqu’à n=2 pour cette tâche.

Les critiques d’entraînement avec n-grammes sont disponibles sous X_train_ng. Les critiques de test correspondantes sont disponibles sous X_test_ng. Enfin, utilisez y_train et y_test pour accéder respectivement aux classes de sentiment d’entraînement et de test.

Cet exercice fait partie du cours

Feature Engineering pour le NLP en Python

Afficher le cours

Instructions

Définissez une instance de MultinomialNB. Nommez-la clf_ng.
Entraînez le classificateur sur X_train_ng et y_train.
Mesurez l’accuracy sur X_test_ng et y_test à l’aide de la méthode score().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Define an instance of MultinomialNB 
clf_ng = ____

# Fit the classifier 
clf_ng.____(____, ____)

# Measure the accuracy 
accuracy = ____
print("The accuracy of the classifier on the test set is %.3f" % accuracy)

# Predict the sentiment of a negative review
review = "The movie was not good. The plot had several holes and the acting lacked panache."
prediction = clf_ng.predict(ng_vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))

Modifier et exécuter le code