1. 学习
  2. /
  3. 课程
  4. /
  5. R による Supervised Learning:回帰

Connected

练习

vtreat で自転車レンタルデータを前処理する

この演習では、後で xgboost で使うために、7月/8月の自転車データをワンホットエンコードしたデータフレームを作成します。

データフレーム bikesJuly と bikesAugust はすでに読み込まれています。

利便性のため、モデル用の変数列のリストを持つ変数 vars を用意しています。

说明

100 XP
  • パッケージ vtreat を読み込みます。
  • designTreatmentsZ() を使って、bikesJuly(学習データ)の vars に含まれる変数に対するトリートメントプラン treatplan を作成します。
    • 関数が多数のメッセージを出力しないよう、フラグ verbose=FALSE を設定します。
  • clean と lev の変換変数名だけを含むベクトル newvars を作るよう、空欄を埋めてください。作成したら表示します。
  • prepare() を使って、ワンホットエンコード済みの学習用データフレーム bikesJuly.treat を作成します。
    • 使用する変数を newvars に制限するため、引数 varRestrictions を指定します。
  • 同様に、prepare() を使って bikesAugust からワンホットエンコード済みのテスト用データフレーム bikesAugust.treat を作成します。
  • 構造を確認するため、準備した両方のデータフレームに対して str() を呼び出します。