1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的机器学习特征工程

Connected

道练习

高层级文本特征

在完成清洗和标准化后,您就可以开始从文本数据中创建特征。对于自由文本,最基础的信息就是其规模,例如长度和单词数。在本练习(以及本章其余部分)中,您将专注于上一练习中创建的清洗/转换后的文本列(text_clean)。

说明

100 XP
  • 将每篇演讲的字符长度记录在 char_count 列中。
  • 将每篇演讲的单词数记录在 word_count 列中。
  • 将每篇演讲的平均单词长度记录在 avg_word_length 列中。