1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ caret を使った Machine Learning

Connected

演習

箱ひげ図を作成する

caret にはモデル比較に使えるさまざまな方法が用意されています。これらはすべて resamples() 関数に基づいています。中でも私のお気に入りは箱ひげ図で、2 つのモデルについて予測精度(この場合は AUC)の分布を比較できます。

一般に、AUC の中央値が高く、さらに最小値と最大値の範囲が狭いモデルが望ましいです。

このプロットは bwplot() 関数で作成できます。これはモデルのアウトオブサンプルのスコアに対する箱ひげ図を描きます。箱ひげ図では、各分布の中央値を線で、四分位範囲を中央値の線を囲む箱で表します。bwplot() 関数に metric = "ROC" 引数を渡すと、モデルのアウトオブサンプルの ROC スコアのプロットが表示され、中央値の ROC が最も高いモデルを選べます。

どの指標を描画するか指定しない場合、bwplot() は自動的に 3 つの指標をプロットします。

指示

100 XP

箱ひげ図を作るために、resamples オブジェクトを bwplot() 関数に渡してください。表示されたプロットを確認し、どのモデルの ROC の中央値が高いかを確認しましょう。どの指標をプロットするかも必ず指定してください。