Modelini inceleme
Artık bir "sahte haber" sınıflandırıcısı oluşturduğuna göre, modelin ne öğrendiğini inceleyeceksin. Bazı basit inceleme teknikleriyle önemli vektör ağırlıklarını gerçek kelimelerle eşleyebilirsin.
Elinde, iyi performans gösteren tfidf Naive Bayes sınıflandırıcın nb_classifier olarak ve vektörlerin tfidf_vectorizer olarak mevcut.
Bu egzersiz
Python ile Doğal Dil İşlemeye Giriş
kursunun bir parçasıdırEgzersiz talimatları
nb_classifierın.classes_özniteliğine erişerek sınıf etiketleriniclass_labelsolarak kaydet.tfidf_vectorizerın.get_feature_names()metodunu kullanarak özellikleri çıkar.- Sınıflandırıcının katsayılarını özellik adlarıyla zipleyip katsayılara göre sırala. Bunu yapmak için önce
zip()inb_classifier.coef_[0]vefeature_namesargümanlarıyla kullan. Ardından bunun üzerindesorted()kullan. class_labelsın ilk etiketi için en yüksek ağırlıklı ilk 20 özelliği ve ikinci etiketi için en düşük ağırlıklı son 20 özelliği yazdır. Bu senin için yapıldı.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Get the class labels: class_labels
class_labels = ____
# Extract the features: feature_names
feature_names = ____
# Zip the feature names together with the coefficient array and sort by weights: feat_with_weights
feat_with_weights = ____(____(____, ____))
# Print the first class label and the top 20 feat_with_weights entries
print(class_labels[0], feat_with_weights[:20])
# Print the second class label and the bottom 20 feat_with_weights entries
print(class_labels[1], feat_with_weights[-20:])