1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

係数を読み解く

出発空港 org には 8 つの値(ORD, SFO, JFK, LGA, SMF, SJC, TUS, OGG)があり、org_dummy ではワンホットエンコーディングで 7 個のダミー変数に変換されています。

km と org_dummy の値は疎行列表現で 8 列の features にまとめられています。features の列インデックスは次のとおりです。

  • 0 — km
  • 1 — ORD
  • 2 — SFO
  • 3 — JFK
  • 4 — LGA
  • 5 — SMF
  • 6 — SJC
  • 7 — TUS

OGG は出発空港カテゴリの基準レベルであるため、この一覧には含まれていない点に注意してください。

LinearRegression のインスタンスが regression として利用可能です。この演習では、モデルを解釈するために intercept と coefficients 属性を使います。

coefficients 属性はリストで、最初の要素は飛行距離が増えると飛行時間がどのように変化するかを示します。

指示

100 XP
  • 平均速度(km/時)を求めてください。モデルがより高度になったため、以前に得た値とは異なるはずです。
  • OGG での地上滞在の平均時間はどれくらいですか。
  • JFK での地上滞在の平均時間はどれくらいですか。
  • LGA での地上滞在の平均時間はどれくらいですか。