1. Learn
  2. /
  3. 课程
  4. /
  5. Python 自然语言处理入门

Connected

道练习

检查您的模型

现在您已经构建了一个"虚假新闻"分类器,接下来要查看它学到了什么。您可以通过一些简单的检查技巧,将重要的向量权重映射回真实单词。

性能良好的 tfidf 朴素贝叶斯分类器已作为 nb_classifier 提供,向量器为 tfidf_vectorizer。

说明

100 XP
  • 通过访问 nb_classifier 的 .classes_ 属性,将类别标签保存为 class_labels。
  • 使用 tfidf_vectorizer 的 .get_feature_names() 方法提取特征。
  • 将分类器的系数与特征名打包为压缩数组,并按系数排序。为此,先使用 zip(),参数为 nb_classifier.coef_[0] 和 feature_names。然后对其使用 sorted()。
  • 打印 class_labels 第一个标签的前 20 个高权重特征,并打印 class_labels 第二个标签的后 20 个低权重特征。此步骤已为您完成。