1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

フライトの線形回帰を最適化する

これまではモデルを作成するとき、既定のハイパーパラメータを使用してきました。この演習では、cross validation を使って、最適(もしくは最適に近い)なハイパーパラメータの組み合わせを選びます。

以下はすでに作成済みです。

  • regression — LinearRegression オブジェクト
  • pipeline — StringIndexer、OneHotEncoder、VectorAssembler、LinearRegression からなるパイプライン
  • evaluator — RegressionEvaluator オブジェクト。

指示

100 XP
  • パラメータグリッドビルダーを作成します。
  • regression.regParam(0.01、0.1、1.0、10.0)と regression.elasticNetParam(0.0、0.5、1.0)に対するグリッドを追加します。
  • グリッドを構築します。
  • 5 分割の cross validator を作成します。