モデルを確認する

「フェイクニュース」分類器を作成できたので、次はその学習内容を確認します。簡単な検査手法を使って、重要なベクトルの重みを実際の単語に対応付けることができます。

高い性能の tfidf Naive Bayes 分類器は nb_classifier、ベクトル化器は tfidf_vectorizer として用意されています。

nb_classifier の .classes_ 属性にアクセスして、クラスラベルを class_labels として保存します。
tfidf_vectorizer の .get_feature_names() メソッドを使って特徴量を抽出します。
分類器の係数と特徴量名を zip で組にし、係数でソートします。具体的には、まず zip() に nb_classifier.coef_[0] と feature_names を渡します。次に、その結果に sorted() を使います。
class_labels の最初のラベルについて重みの大きい上位20個の特徴量を表示し、class_labels の2番目のラベルについて重みの小さい下位20個の特徴量を表示します。これはすでに用意されています。