N-gram tingkat lebih tinggi untuk analisis sentimen
Mirip dengan latihan sebelumnya, kita akan membangun sebuah pengklasifikasi yang dapat mendeteksi apakah ulasan sebuah film bersentimen positif atau negatif. Namun, kali ini kita akan menggunakan n-gram hingga n=2 untuk tugas tersebut.
Ulasan pelatihan n-gram tersedia sebagai X_train_ng. Ulasan pengujian yang sesuai tersedia sebagai X_test_ng. Terakhir, gunakan y_train dan y_test untuk mengakses kelas sentimen pelatihan dan pengujian masing-masing.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur untuk NLP di Python
Petunjuk latihan
- Definisikan sebuah instance dari MultinomialNB. Namai
clf_ng - Latih pengklasifikasi pada
X_train_ngdany_train. - Ukur
accuracypadaX_test_ngdany_testmenggunakan metodescore().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define an instance of MultinomialNB
clf_ng = ____
# Fit the classifier
clf_ng.____(____, ____)
# Measure the accuracy
accuracy = ____
print("The accuracy of the classifier on the test set is %.3f" % accuracy)
# Predict the sentiment of a negative review
review = "The movie was not good. The plot had several holes and the acting lacked panache."
prediction = clf_ng.predict(ng_vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))