1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Python 中的机器学习预处理

Connected

Exercise

文本向量化

现在请将 UFO 数据集中的 desc 列转换为 tf/idf 向量,因为这个字段很可能包含有用的信息。

Instrukcje

100 XP
  • 打印 desc 列的 .head()。
  • 实例化一个 TfidfVectorizer() 对象。
  • 使用 vec 拟合并转换 desc 列。
  • 打印 desc_tfidf 向量的 .shape,查看由此产生的列数。