MulaiMulai sekarang secara gratis

Melatih dan menguji model "fake news" dengan TfidfVectorizer

Sekarang setelah Anda mengevaluasi model menggunakan CountVectorizer, Anda akan melakukan hal yang sama menggunakan TfidfVectorizer dengan model Naive Bayes.

Himpunan data latih dan uji telah dibuat, serta tfidf_vectorizer, tfidf_train, dan tfidf_test telah dihitung. Selain itu, MultinomialNB dan metrics telah diimpor masing-masing dari sklearn.naive_bayes dan sklearn.

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di Python

Lihat Kursus

Petunjuk latihan

  • Instansiasi classifier MultinomialNB bernama nb_classifier.
  • Latih classifier pada data latih.
  • Hitung tag prediksi untuk data uji.
  • Hitung dan cetak skor akurasi dari classifier.
  • Hitung confusion matrix. Seperti pada latihan sebelumnya, tentukan argumen kata kunci labels=['FAKE', 'REAL'] agar confusion matrix yang dihasilkan lebih mudah dibaca.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Edit dan Jalankan Kode