1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ特徴量エンジニアリング

Connected

演習

ホテル予約を予測する

ホスピタリティ分野のリサーチ会社に入社し、最初のタスクとして「ホテル滞在に子どもが含まれるかどうか」を予測するモデルを作成します。 モデルの学習には、Antonio、Almeida、Nunes (2019) による hotel booking demands データセットの改変版を使用します。データは次の特徴量に絞ります。

features <- c('hotel', 'adults', 
              'children', 'meal',
              'reserved_room_type', 
              'customer_type', 
              'arrival_date')

データは hotels として読み込まれており、対応する test と train の分割も用意されています。モデルは lr_model <- logistic_reg() として宣言済みです。

モデル性能は、正解率(accuracy)と、ROC 曲線下面積(AUC)で評価します。

指示1 / 2

undefined XP
    1
    2
  • 「曜日」「週」「月」の特徴量を生成します。
  • すべての名義予測子についてダミー変数を作成します。