1. Learn
  2. /
  3. 课程
  4. /
  5. Python 中的机器学习预处理

Connected

道练习

编码分类变量——独热编码

在 volunteer 数据集中的一列 category_desc,给出了志愿服务机会的类别描述。由于这是一个包含 2 个以上类别的分类变量,我们需要使用独热编码将该列数值化。请使用 pandas 的 pd.get_dummies() 函数完成转换。

说明

100 XP
  • 对 volunteer["category_desc"] 列调用 get_dummies(),生成编码后的列,并将结果赋值给 category_enc。
  • 打印 category_enc 的 .head(),查看编码后的列。