1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

列の操作

Federal Aviation Administration (FAA) は、予定時刻より15分以上遅れて到着した便を「遅延」と見なします。

フライトデータの前処理の次のステップは2つあります。

  1. 距離の単位を変換し、mile 列を km 列に置き換えること。
  2. 便が遅延したかどうかを示すブール列を作成すること。

指示

100 XP
  • 小数点以下の桁数を指定して丸めるための関数をインポートしてください。
  • mile 列から新しい km 列を作成し、小数第0位に丸めてください。1マイルは 1.60934 km です。
  • mile 列を削除してください。
  • 遅延が15分以上なら 1、それ以外は 0 の値を持つ label 列を作成してください。論理条件をよく考えて記述しましょう。