1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

シンプルなフライト所要時間モデルの交差検証

これまでにフライトの所要時間を予測するモデルをいくつか作成し、単純な学習用/テスト用の分割で評価してきました。しかし、交差検証を使うとモデル性能をより適切に評価できます。

この演習では、交差検証を用いてフライト所要時間のシンプルなモデルを学習します。移動時間は通常、距離と強く相関するため、km 列だけでも十分に良いモデルが期待できます。

データはランダムに flights_train と flights_test に分割されています。

次のクラスはすでにインポート済みです: LinearRegression、RegressionEvaluator、ParamGridBuilder、CrossValidator。

指示

100 XP
  • 空のパラメータグリッドを作成します。
  • 線形回帰モデルの作成と評価用のオブジェクトを作成します。モデルは "duration" フィールドを予測するようにしてください。
  • 交差検証用のオブジェクトを作成します。estimator、estimatorParamMaps、evaluator 引数に値を指定し、5 分割交差検証を選択します。
  • 学習データの複数のフォールドにわたってモデルを学習・評価します。