1. Learn
  2. /
  3. Courses
  4. /
  5. Machine Learning with PySpark

Connected

Exercise

Random Forest の評価

この最後の演習では、Random Forest モデルに対するクロスバリデーションの結果を評価します。

以下はすでに作成されています。

  • cv — 学習データに対してすでに学習済みのクロスバリデータ
  • evaluator — BinaryClassificationEvaluator オブジェクト
  • flights_test — テスト用データ

Instructions

100 XP
  • パラメータグリッド内のすべてのモデルにおける平均 AUC 指標のリストを出力します。
  • ベストモデルの平均 AUC を表示します。これはリストの中で「最も大きい」AUC です。
  • ベストモデルの maxDepth と featureSubsetStrategy パラメータについての説明を出力します。
  • テストデータに対するベストモデルの予測について、AUC を表示します。