Melatih dan menguji model "fake news" dengan TfidfVectorizer
Sekarang setelah Anda mengevaluasi model menggunakan CountVectorizer, Anda akan melakukan hal yang sama menggunakan TfidfVectorizer dengan model Naive Bayes.
Himpunan data latih dan uji telah dibuat, serta tfidf_vectorizer, tfidf_train, dan tfidf_test telah dihitung. Selain itu, MultinomialNB dan metrics telah diimpor masing-masing dari sklearn.naive_bayes dan sklearn.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di Python
Petunjuk latihan
- Instansiasi classifier
MultinomialNBbernamanb_classifier. - Latih classifier pada data latih.
- Hitung tag prediksi untuk data uji.
- Hitung dan cetak skor akurasi dari classifier.
- Hitung confusion matrix. Seperti pada latihan sebelumnya, tentukan argumen kata kunci
labels=['FAKE', 'REAL']agar confusion matrix yang dihasilkan lebih mudah dibaca.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)