MulaiMulai sekarang secara gratis

Melatih dan menguji model "fake news" dengan CountVectorizer

Sekarang giliran Anda melatih model "fake news" menggunakan fitur yang telah Anda identifikasi dan ekstrak. Pada latihan pertama ini Anda akan melatih dan menguji model Naive Bayes menggunakan data dari CountVectorizer.

Himpunan data latih dan uji sudah dibuat, dan count_vectorizer, count_train, serta count_test telah dihitung.

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di Python

Lihat Kursus

Petunjuk latihan

  • Impor modul metrics dari sklearn dan MultinomialNB dari sklearn.naive_bayes.
  • Instansiasi classifier MultinomialNB bernama nb_classifier.
  • Latih classifier pada data latih.
  • Hitung tag prediksi untuk data uji.
  • Hitung dan cetak skor akurasi dari classifier.
  • Hitung confusion matrix. Agar lebih mudah dibaca, tetapkan argumen kata kunci labels=['FAKE', 'REAL'].

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the necessary modules
____
____

# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____

# Fit the classifier to the training data
____

# Create the predicted tags: pred
pred = ____

# Calculate the accuracy score: score
score = ____
print(score)

# Calculate the confusion matrix: cm
cm = ____
print(cm)
Edit dan Jalankan Kode