Memeriksa model Anda
Setelah Anda membangun pengklasifikasi "fake news", Anda akan menyelidiki apa yang telah dipelajari olehnya. Anda dapat memetakan bobot vektor penting kembali ke kata-kata sebenarnya menggunakan beberapa teknik inspeksi sederhana.
Anda memiliki tfidf Naive Bayes classifier yang berkinerja baik tersedia sebagai nb_classifier, dan vektor sebagai tfidf_vectorizer.
Latihan ini adalah bagian dari kursus
Pengantar Natural Language Processing di Python
Petunjuk latihan
- Simpan label kelas sebagai
class_labelsdengan mengakses atribut.classes_darinb_classifier. - Ekstrak fitur menggunakan metode
.get_feature_names()daritfidf_vectorizer. - Buat array hasil zip dari koefisien classifier dengan nama fitur dan urutkan berdasarkan koefisiennya. Untuk melakukan ini, pertama gunakan
zip()dengan argumennb_classifier.coef_[0]danfeature_names. Lalu, gunakansorted()pada hasil tersebut. - Cetak 20 fitur berbobot teratas untuk label pertama dari
class_labelsdan cetak 20 fitur berbobot paling bawah untuk label kedua dariclass_labels. Ini telah disiapkan untuk Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Get the class labels: class_labels
class_labels = ____
# Extract the features: feature_names
feature_names = ____
# Zip the feature names together with the coefficient array and sort by weights: feat_with_weights
feat_with_weights = ____(____(____, ____))
# Print the first class label and the top 20 feat_with_weights entries
print(class_labels[0], feat_with_weights[:20])
# Print the second class label and the bottom 20 feat_with_weights entries
print(class_labels[1], feat_with_weights[-20:])