TfidfVectorizer ile "fake news" modelini eğitme ve test etme
CountVectorizer kullanarak modeli değerlendirdiğine göre, şimdi aynı işlemi Naive Bayes modeliyle TfidfVectorizer kullanarak yapacaksın.
Eğitim ve test kümeleri oluşturuldu, ayrıca tfidf_vectorizer, tfidf_train ve tfidf_test hesaplandı. Ek olarak, MultinomialNB ve metrics sırasıyla sklearn.naive_bayes ve sklearn içinden içe aktarıldı.
Bu egzersiz
Python ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
nb_classifieradlı birMultinomialNBsınıflandırıcısı oluştur.- Sınıflandırıcıyı eğitim verisine uydur.
- Test verisi için tahmin edilen etiketleri hesapla.
- Sınıflandırıcının doğruluk puanını hesaplayıp yazdır.
- Karmaşıklık matrisini hesapla. Önceki egzersizde olduğu gibi, ortaya çıkan karmaşıklık matrisinin okunmasını kolaylaştırmak için
labels=['FAKE', 'REAL']anahtar argümanını belirt.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a Multinomial Naive Bayes classifier: nb_classifier
nb_classifier = ____
# Fit the classifier to the training data
____
# Create the predicted tags: pred
pred = ____
# Calculate the accuracy score: score
score = ____
print(score)
# Calculate the confusion matrix: cm
cm = ____
print(cm)