1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python 中的机器学习预处理

Connected

Bài tập

对类别变量进行编码

UFO 数据集中有几列在用 scikit-learn 建模前需要先进行编码。您将在这里完成该转换,分别使用二元编码和独热编码两种方法。

Hướng dẫn

100 XP
  • 使用 apply() 编写条件 lambda 函数:当取值为 "us" 时返回 1,否则返回 0。
  • 打印 type 列中 .unique() 值的数量。
  • 使用 pd.get_dummies() 对 type 列进行独热编码。
  • 最后使用 pd.concat() 将编码后的 type_set 变量拼接回 ufo 数据集。