大きい誤差には大きいペナルティ

すべての誤差は誤差ですが、同じ重さとは限りません。状況によっては、小さな誤差よりも大きな予測誤差のほうが影響がはるかに大きいことがあります。

大きい誤差には大きいペナルティ —— これが RMSE（root mean squared error、二乗平均平方根誤差）の特徴のひとつです。RMSE は誤差を二乗するため、大きな外れ値の誤差を小さな誤差より強く罰します。

RMSE は次の式で計算できます。ここで $i$ 番目の squared_diff は、$i$ 番目の誤差を二乗したものです。

$$RMSE = \sqrt{\frac{1}{n} \cdot \sum_{i=1} ^n i\text{th squared_diff}}$$

この演習では、予測の RMSE を計算します。

ワークスペースには前の演習の結果である test_enriched が用意されています。これはテストデータにモデルのサンプル外予測を表す新しい列 .pred を追加したものです。

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}演習