N-grams de ordem superior para análise de sentimento
Assim como em um exercício anterior, vamos construir um classificador que detecta se a avaliação de um filme é positiva ou negativa. Porém, desta vez, vamos usar n-grams até n=2 para a tarefa.
As avaliações de treino com n-grams estão disponíveis em X_train_ng. As avaliações de teste correspondentes estão em X_test_ng. Por fim, use y_train e y_test para acessar as classes de sentimento de treino e teste, respectivamente.
Este exercício faz parte do curso
Feature Engineering para NLP em Python
Instruções do exercício
- Defina uma instância de MultinomialNB. Dê a ela o nome
clf_ng. - Treine o classificador com
X_train_ngey_train. - Meça a
accuracyemX_test_ngey_testusando o métodoscore().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define an instance of MultinomialNB
clf_ng = ____
# Fit the classifier
clf_ng.____(____, ____)
# Measure the accuracy
accuracy = ____
print("The accuracy of the classifier on the test set is %.3f" % accuracy)
# Predict the sentiment of a negative review
review = "The movie was not good. The plot had several holes and the acting lacked panache."
prediction = clf_ng.predict(ng_vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))