ComeçarComece de graça

N-grams de ordem superior para análise de sentimento

Assim como em um exercício anterior, vamos construir um classificador que detecta se a avaliação de um filme é positiva ou negativa. Porém, desta vez, vamos usar n-grams até n=2 para a tarefa.

As avaliações de treino com n-grams estão disponíveis em X_train_ng. As avaliações de teste correspondentes estão em X_test_ng. Por fim, use y_train e y_test para acessar as classes de sentimento de treino e teste, respectivamente.

Este exercício faz parte do curso

Feature Engineering para NLP em Python

Ver curso

Instruções do exercício

  • Defina uma instância de MultinomialNB. Dê a ela o nome clf_ng.
  • Treine o classificador com X_train_ng e y_train.
  • Meça a accuracy em X_test_ng e y_test usando o método score().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Define an instance of MultinomialNB 
clf_ng = ____

# Fit the classifier 
clf_ng.____(____, ____)

# Measure the accuracy 
accuracy = ____
print("The accuracy of the classifier on the test set is %.3f" % accuracy)

# Predict the sentiment of a negative review
review = "The movie was not good. The plot had several holes and the acting lacked panache."
prediction = clf_ng.predict(ng_vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))
Editar e executar o código