1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

フライト所要時間モデル:出発時刻の追加

前の演習では、出発時刻をビン分割してダミー変数に変換しました。ここでは、それらのダミー変数をフライト所要時間の回帰モデルに組み込みます。

データは flights にあります。km、org_dummy、depart_dummy 列は features にまとめられており、km はインデックス 0、org_dummy はインデックス 1〜7、depart_dummy はインデックス 8〜14 に対応します。

データは学習用とテスト用に分割され、線形回帰モデル regression は学習データで作成済みです。テストデータに対する予測は predictions として利用できます。

指示

100 XP
  • テストデータに対する予測の RMSE を求めてください。
  • OGG 発・21:00〜24:00 出発のフライトで、地上で過ごした平均時間を求めてください。
  • OGG 発・03:00〜06:00 出発のフライトで、地上で過ごした平均時間を求めてください。
  • JFK 発・03:00〜06:00 出発のフライトで、地上で過ごした平均時間を求めてください。