1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ caret を使った Machine Learning

Connected

演習

前処理手法の組み合わせ

train() の preProcess 引数は、欠損値の代入だけに限りません。データサイエンティストの作業を大幅に楽にする、幅広い preProcess 手法が用意されています。全一覧は ?preProcess と入力して、この関数のヘルプページを参照してください。

回帰モデルの学習で特に有用な前処理のひとつが標準化(センタリングとスケーリング)です。まず各列の平均を各値から引いて「センタリング」し、その後、標準偏差で割って「スケーリング」します。

標準化により、各列の平均が0、標準偏差が1になるようにデータが変換されます。これにより、回帰モデルが良い解を見つけやすくなります。

指示1 / 2

undefined XP
  • 1

    breast_cancer_x と breast_cancer_y はワークスペースに読み込まれています。中央値代入を用いたロジスティック回帰モデルを乳がんデータに当てはめ、model という名前で作成してから、コンソールに出力してください。

  • 2

    モデルを更新して、センタリングとスケーリングという2つの前処理ステップを追加してください。