1. Learn
  2. /
  3. 课程
  4. /
  5. Python 树模型机器学习

Connected

道练习

训练您的第一个分类树

在本练习中,您将使用 UCI 机器学习库中的 威斯康星乳腺癌数据集。您将基于两个特征来预测肿瘤是恶性的还是良性的:肿瘤的平均半径(radius_mean)以及平均凹点数量(concave points_mean)。

数据集已加载到您的工作空间,并按 80% 训练集、20% 测试集进行划分。特征矩阵分别赋给 X_train 和 X_test,标签数组分别赋给 y_train 和 y_test,其中类别 1 表示恶性肿瘤,类别 0 表示良性肿瘤。为获得可复现实验结果,我们还定义了名为 SEED 的变量并将其设为 1。

说明

100 XP
  • 从 sklearn.tree 导入 DecisionTreeClassifier。

  • 实例化一个最大深度为 6 的 DecisionTreeClassifier,命名为 dt。

  • 将 dt 拟合到训练集。

  • 预测测试集标签,并将结果赋给 y_pred。