1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySpark入門

Connected

演習

評価器を作成する

モデル選択のためにクロスバリデーションを行う際、最初に必要なのは、異なるモデルを比較する方法です。幸い、pyspark.ml.evaluation サブモジュールには、さまざまな種類のモデルを評価するクラスがあります。今回のモデルは二値分類モデルなので、pyspark.ml.evaluation モジュールの BinaryClassificationEvaluator を使います。

この評価器は ROC 曲線下面積(AUC)を計算します。これは、二値分類器が起こしうる 2 種類の誤り(偽陽性と偽陰性)を 1 つの数値にまとめた指標です。章の終わりで、これについてさらに詳しく学びます。

指示

100 XP
  • サブモジュール pyspark.ml.evaluation を evals としてインポートします。
  • 引数 metricName="areaUnderROC" を指定して evals.BinaryClassificationEvaluator() を呼び出し、evaluator を作成します。