1. Learn
  2. /
  3. 课程
  4. /
  5. Python 树模型机器学习

Connected

道练习

评估最优树模型

在本练习中,您将评估 grid_dt 的最优模型在测试集上的 ROC AUC 分数。

为此,您将首先为测试集中的每个观测确定获得正类标签的概率。您可以使用 sklearn 分类器的 predict_proba() 方法来计算一个二维数组,其列分别为负类和正类标签的概率。

数据集已为您加载并预处理(数值特征已标准化);数据已按 80% 训练集、20% 测试集切分。X_test、y_test 已在您的工作区中可用。此外,我们还加载了您在上一个练习中实例化并训练好的 GridSearchCV 对象 grid_dt。请注意,grid_dt 的训练方式如下:

grid_dt.fit(X_train, y_train)

说明

100 XP
  • 从 sklearn.metrics 导入 roc_auc_score。

  • 从 grid_dt 中提取 .best_estimator_ 属性并赋值给 best_model。

  • 预测测试集获得正类的概率,赋值给 y_pred_proba。

  • 计算 best_model 在测试集上的 ROC AUC 分数 test_roc_auc。