1. Learn
  2. /
  3. 课程
  4. /
  5. Python 自然语言处理入门

Connected

道练习

使用 TfidfVectorizer 训练与测试"假新闻"模型

现在,您已经用 CountVectorizer 评估了模型,接下来将使用 TfidfVectorizer 搭配朴素贝叶斯模型做相同的评估。

训练集和测试集已创建,tfidf_vectorizer、tfidf_train 和 tfidf_test 已计算完毕。此外,已分别从 sklearn.naive_bayes 和 sklearn 导入了 MultinomialNB 和 metrics。

说明

100 XP
  • 实例化一个名为 nb_classifier 的 MultinomialNB 分类器。
  • 将分类器拟合到训练数据。
  • 计算测试数据的预测标签。
  • 计算并打印分类器的准确率。
  • 计算混淆矩阵。与上一个练习相同,指定关键字参数 labels=['FAKE', 'REAL'],以便更容易阅读结果混淆矩阵。