1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

大きい誤差には大きいペナルティ

すべての誤差は誤差ですが、同じ重さとは限りません。状況によっては、小さな誤差よりも大きな予測誤差のほうが影響がはるかに大きいことがあります。

大きい誤差には大きいペナルティ —— これが RMSE(root mean squared error、二乗平均平方根誤差)の特徴のひとつです。RMSE は誤差を二乗するため、大きな外れ値の誤差を小さな誤差より強く罰します。

RMSE は次の式で計算できます。ここで \(i\) 番目の squared_diff は、\(i\) 番目の誤差を二乗したものです。

$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$

この演習では、予測の RMSE を計算します。

ワークスペースには前の演習の結果である test_enriched が用意されています。これはテストデータにモデルのサンプル外予測を表す新しい列 .pred を追加したものです。

指示

100 XP
  • 予測値と最終成績の要素ごとの差を計算し、それを二乗して squared_diffs として保存します。
  • 上の式を使って RMSE を計算し、rmse_manual として保存します。
  • rmse() 関数を使って誤差を計算し、rmse_auto として保存します。
  • rmse_manual と rmse_auto を出力し、同じ値であることを確認します。