1. 学习
  2. /
  3. 课程
  4. /
  5. Python 中的机器学习预处理

Connected

练习

UFO 数据集建模,第 1 部分

在本练习中,您将构建一个 k 近邻模型,用来预测 UFO 目击事件发生的国家。数据集 X 包含对 seconds 列取对数并标准化后的结果、对 type 列进行独热编码后得到的列,以及目击发生的月份和年份。标签 y 是编码后的国家列,其中 1 表示 "us",0 表示 "ca"。

说明

100 XP
  • 打印 X 集的 .columns。
  • 切分 X 和 y,确保训练集与测试集中的标签类别分布一致,并使用 random_state 为 42。
  • 将 knn 拟合到训练数据。
  • 打印 knn 模型在测试集上的准确率。