1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

Gradient-Boosted Trees による遅延フライトの判定

これまでに、Decision Tree を使って遅延しやすいフライトを判定する分類器を作成しました。この演習では、Decision Tree モデルと Gradient-Boosted Trees モデルを比較します。

フライトのデータはランダムに flights_train と flights_test に分割されています。

指示

100 XP
  • Decision Tree と Gradient-Boosted Tree の分類器を作成するために必要なクラスをインポートします。
  • Decision Tree と Gradient-Boosted Tree の分類器を作成し、学習用データで訓練します。
  • 評価器を作成し、両方の分類器についてテストデータで AUC を計算します。どちらのモデルがより高性能ですか?
  • Gradient-Boosted Tree 分類器について、木の本数と特徴量の相対的重要度を出力します。