MulaiMulai sekarang secara gratis

N-gram tingkat lebih tinggi untuk analisis sentimen

Mirip dengan latihan sebelumnya, kita akan membangun sebuah pengklasifikasi yang dapat mendeteksi apakah ulasan sebuah film bersentimen positif atau negatif. Namun, kali ini kita akan menggunakan n-gram hingga n=2 untuk tugas tersebut.

Ulasan pelatihan n-gram tersedia sebagai X_train_ng. Ulasan pengujian yang sesuai tersedia sebagai X_test_ng. Terakhir, gunakan y_train dan y_test untuk mengakses kelas sentimen pelatihan dan pengujian masing-masing.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur untuk NLP di Python

Lihat Kursus

Petunjuk latihan

  • Definisikan sebuah instance dari MultinomialNB. Namai clf_ng
  • Latih pengklasifikasi pada X_train_ng dan y_train.
  • Ukur accuracy pada X_test_ng dan y_test menggunakan metode score().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define an instance of MultinomialNB 
clf_ng = ____

# Fit the classifier 
clf_ng.____(____, ____)

# Measure the accuracy 
accuracy = ____
print("The accuracy of the classifier on the test set is %.3f" % accuracy)

# Predict the sentiment of a negative review
review = "The movie was not good. The plot had several holes and the acting lacked panache."
prediction = clf_ng.predict(ng_vectorizer.transform([review]))[0]
print("The sentiment predicted by the classifier is %i" % (prediction))
Edit dan Jalankan Kode