MulaiMulai sekarang secara gratis

Memeriksa model Anda

Setelah Anda membangun pengklasifikasi "fake news", Anda akan menyelidiki apa yang telah dipelajari olehnya. Anda dapat memetakan bobot vektor penting kembali ke kata-kata sebenarnya menggunakan beberapa teknik inspeksi sederhana.

Anda memiliki tfidf Naive Bayes classifier yang berkinerja baik tersedia sebagai nb_classifier, dan vektor sebagai tfidf_vectorizer.

Latihan ini adalah bagian dari kursus

Pengantar Natural Language Processing di Python

Lihat Kursus

Petunjuk latihan

  • Simpan label kelas sebagai class_labels dengan mengakses atribut .classes_ dari nb_classifier.
  • Ekstrak fitur menggunakan metode .get_feature_names() dari tfidf_vectorizer.
  • Buat array hasil zip dari koefisien classifier dengan nama fitur dan urutkan berdasarkan koefisiennya. Untuk melakukan ini, pertama gunakan zip() dengan argumen nb_classifier.coef_[0] dan feature_names. Lalu, gunakan sorted() pada hasil tersebut.
  • Cetak 20 fitur berbobot teratas untuk label pertama dari class_labels dan cetak 20 fitur berbobot paling bawah untuk label kedua dari class_labels. Ini telah disiapkan untuk Anda.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Get the class labels: class_labels
class_labels = ____

# Extract the features: feature_names
feature_names = ____

# Zip the feature names together with the coefficient array and sort by weights: feat_with_weights
feat_with_weights = ____(____(____, ____))

# Print the first class label and the top 20 feat_with_weights entries
print(class_labels[0], feat_with_weights[:20])

# Print the second class label and the bottom 20 feat_with_weights entries
print(class_labels[1], feat_with_weights[-20:])
Edit dan Jalankan Kode