1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

フライト所要時間モデル:距離のみ

この演習では、フライトの所要時間(duration 列)を予測する回帰モデルを作成します。

まずはモデルをシンプルに保ち、予測子としてフライトの距離(km 列)のみを含めます。

データは flights にあります。先頭のレコードはターミナルに表示されています。これらのデータはすでに学習用とテスト用に分割されており、flights_train と flights_test として利用できます。

指示

100 XP
  • 線形回帰オブジェクトを作成し、ラベル列の名前を指定して、学習用データにフィットさせてください。
  • テスト用データに対して予測を行ってください。
  • 回帰評価器オブジェクトを作成し、テスト用データの RMSE を評価してください。