1. 学ぶ
  2. /
  3. コース
  4. /
  5. PySparkで学ぶ特徴量エンジニアリング

Connected

演習

アルゴリズムの評価と比較

GBTRegressor で新しいモデルを作成したので、ベースラインの RandomForestRegressor と比較してみましょう。両モデルの予測値を実測データと照合し、RMSE と R^2 を計算します。

指示

100 XP
  • 後で使えるように、pyspark.ml.evaluation から RegressionEvaluator をインポートします。
  • RegressionEvaluator を初期化し、labelCol には実測データである SALESCLOSEPRICE、predictionCol には予測データである Prediction_Price を設定します。
  • 指標を計算するには、evaluator の evaluate を予測値 preds に対して呼び出し、キーを evaluator.metricName、値を rmse とする辞書を作成します。r2 指標についても同様に行います。