1. Learn
  2. /
  3. 课程
  4. /
  5. Python 自然语言处理入门

Connected

道练习

改进您的模型

本练习中,您的任务是使用 Tfidf 向量尝试几个不同的 alpha 水平,看看是否能得到更好的组合。

训练集和测试集已创建,tfidf_vectorizer、tfidf_train 和 tfidf_test 已计算完毕。

说明

100 XP
  • 使用 np.arange() 创建要尝试的 alpha 列表。取值范围应从 0 到 1,步长为 0.1。
  • 创建函数 train_and_predict(),接收 1 个参数:alpha。该函数应:
    • 使用 alpha=alpha 实例化一个 MultinomialNB 分类器。
    • 在训练数据上进行拟合。
    • 在测试数据上进行预测。
    • 计算并返回准确率分数。
  • 使用 for 循环,打印 alpha、score,并在两者之间打印一个换行。使用您的 train_and_predict() 函数来计算 score。分数会随着 alpha 变化吗?最优的 alpha 是多少?