Melatih dan menguji model "fake news" dengan CountVectorizer
Sekarang giliran Anda melatih model "fake news" menggunakan fitur yang telah Anda identifikasi dan ekstrak. Pada latihan pertama ini Anda akan melatih dan menguji model Naive Bayes menggunakan data dari CountVectorizer.
Himpunan data latih dan uji sudah dibuat, dan count_vectorizer, count_train, serta count_test telah dihitung.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di Python
Petunjuk latihan
- Impor modul
metricsdarisklearndanMultinomialNBdarisklearn.naive_bayes. - Instansiasi classifier
MultinomialNBbernamanb_classifier. - Latih classifier pada data latih.
- Hitung tag prediksi untuk data uji.
- Hitung dan cetak skor akurasi dari classifier.
- Hitung confusion matrix. Agar lebih mudah dibaca, tetapkan argumen kata kunci
labels=['FAKE', 'REAL'].
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the necessary modules
____
____
# Instantiate a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)