1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶTree-Based ModelsによるMachine Learning

Connected

演習

フォールドを評価する

10 個のフォールドそれぞれでモデルを学習し、各モデルの MAE と RMSE を計算できました。次は、誤差の大きさを可視化してみましょう。これにより、サンプル外誤差の分布感覚がつかめ、モデルの質を評価する助けになります。

これらすべての誤差をヒストグラムでプロットし、全フォールドにわたる要約統計量も表示します。

前の演習の結果である fits_cv はすでに読み込まれています。

指示

100 XP
  • fits_cv の全モデルについて、単一の yardstick 関数でサンプル外誤差を収集し、all_errors として保存します。
  • .estimate を x 美的属性に、.metric を基にバーを fill する ggplot2 のヒストグラムを作成します。
  • 最初の指示と同じ関数を summarize = TRUE で用いて、fits_cv の要約統計量を表示します。