1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的机器学习特征工程

Connected

道练习

词频统计(II)

一旦向量化器已在数据上完成拟合,就可以用它将文本转换为表示词频的数组。该数组按文本块进行行划分,并为您在上一个练习中看到的、由向量化器生成的每个特征提供一列。

您在上一个练习中拟合的向量化器(cv)已在您的工作空间中可用。

说明 1 / 共 2 个

undefined XP
    1
    2
  • 将向量化器应用到 text_clean 列。
  • 将转换得到的(稀疏)数组转换为包含计数的 numpy 数组。