Bir film incelemesinin duyarlılığını tahmin etme
Önceki egzersizde, eğitim ve test film inceleme verileri için bag-of-words gösterimlerini oluşturmuştun. Bu egzersizde, bu modeli kullanarak bir film incelemesinin duyarlılığını tespit edebilen bir Naive Bayes sınıflandırıcısı eğitecek ve doğruluğunu hesaplayacağız. Bu bir ikili sınıflandırma problemi olduğundan, model yalnızca bir incelemeyi pozitif (1) ya da negatif (0) olarak sınıflandırabilir. Nötr incelemeleri tespit edemez.
Hatırlamıyorsan, eğitim ve test BoW vektörleri sırasıyla X_train_bow ve X_test_bow olarak mevcut. Karşılık gelen etiketler ise sırasıyla y_train ve y_test olarak mevcut. Ayrıca referansın için, orijinal film inceleme veri kümesi df olarak mevcut.
Bu egzersiz
Python ile NLP için Özellik Mühendisliği
kursunun bir parçasıdırEgzersiz talimatları
MultinomialNBsınıfından bir nesne oluştur. Adıclfolsun.clf'iX_train_bowvey_trainile eğit (fit).clf'in doğruluğunuX_test_bowvey_testile ölç.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a MultinomialNB object
clf = ____
# Fit the classifier
clf.____(____, ____)
# Measure the accuracy
accuracy = clf.score(____, ____)
print("The accuracy of the classifier on the test set is %.3f" % accuracy)
# Predict the sentiment of a negative review
review = "The movie was terrible. The music was underwhelming and the acting mediocre."
prediction = clf.predict(vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))