1. Lära sig
  2. /
  3. Courses
  4. /
  5. Rで学ぶ特徴量エンジニアリング

Connected

exercise

分析に向けたデータの準備

nycflights13 データセットの一部を flights として読み込んであります。これはニューヨーク市から出発するフライトの情報を含みます。目的地への到着が遅れるかどうかを予測したいのですが、その前に分析用にデータを準備する必要があります。

専門家チームとモデルの目標を検討した結果、次の変数をモデルに使うことにしました: flight, sched_dep_time, dep_delay, sched_arr_time, carrier, origin, dest, distance, date, arrival。

また、as.Date() を使って日付を mutate() し、character 型の変数を factor に変換します。

最後に、データを train と test のデータセットに分割します。

Instruktioner

100 XP
  • すべての character 型の変数を factor に変換します。
  • flights データを test と train に分割します。