1. Learn
  2. /
  3. 课程
  4. /
  5. Python 自然语言处理入门

Connected

道练习

使用 CountVectorizer 训练和测试 "fake news" 模型

现在轮到您使用已识别并提取的特征来训练 "fake news" 模型。在这个首个练习中,您将使用 CountVectorizer 得到的数据来训练并测试一个朴素贝叶斯模型。

训练集和测试集已经创建,count_vectorizer、count_train 和 count_test 也都已计算完毕。

说明

100 XP
  • 从 sklearn 导入 metrics 模块,并从 sklearn.naive_bayes 导入 MultinomialNB。
  • 实例化一个名为 nb_classifier 的 MultinomialNB 分类器。
  • 将分类器拟合到训练数据上。
  • 计算测试数据的预测标签。
  • 计算并打印分类器的准确率。
  • 计算混淆矩阵。为便于阅读,请指定关键字参数 labels=['FAKE', 'REAL']。