1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Python 中的机器学习预处理

Connected

अभ्यास

UFO 数据集建模(第 2 部分)

最后,您将使用我们创建的文本向量 desc_tfidf 来构建模型,并使用 filtered_words 列表创建一个经过筛选的文本向量。看看是否能根据文本来预测目击事件的 type。本题将使用朴素贝叶斯模型。

निर्देश

100 XP
  • 通过在索引中传入 filtered_words 的列表来筛选 desc_tfidf 向量。
  • 将 filtered_text 特征与 y 进行划分,确保训练集和测试集中的类别分布相同;使用 random_state 为 42。
  • 使用 nb 模型的 .fit() 拟合 X_train 和 y_train。
  • 打印 nb 模型在 X_test 和 y_test 上的 .score()。