Duygu analizi için daha yüksek dereceli n-gram'lar
Önceki bir egzersize benzer şekilde, belirli bir filmin incelemesinin olumlu mu olumsuz mu olduğunu tespit edebilen bir sınıflandırıcı kuracağız. Ancak bu kez, görev için n=2'ye kadar n-gram'lar kullanacağız.
n-gram eğitim incelemeleri X_train_ng olarak mevcut. Karşılık gelen test incelemeleri X_test_ng olarak mevcut. Son olarak, eğitim ve test duygu sınıflarına sırasıyla y_train ve y_test ile eriş.
Bu egzersiz
Python ile NLP için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
- MultinomialNB'in bir örneğini tanımla. Adı
clf_ngolsun. - Sınıflandırıcıyı
X_train_ngvey_trainüzerinde eğit. score()metodunu kullanarakX_test_ngvey_testüzerindeaccuracyölç.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Define an instance of MultinomialNB
clf_ng = ____
# Fit the classifier
clf_ng.____(____, ____)
# Measure the accuracy
accuracy = ____
print("The accuracy of the classifier on the test set is %.3f" % accuracy)
# Predict the sentiment of a negative review
review = "The movie was not good. The plot had several holes and the acting lacked panache."
prediction = clf_ng.predict(ng_vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))