1. 学ぶ
  2. /
  3. コース
  4. /
  5. Machine Learning with PySpark

Connected

演習

カテゴリ列

flights データには、カテゴリデータを持つ carrier と org の2つの列があります。これらの列を、インデックス化された数値に変換する必要があります。

指示

100 XP
  • 適切なクラスをインポートし、carrier 列を文字列から数値インデックスに変換するための indexer オブジェクトを作成します。
  • フライトデータで indexer オブジェクトを準備します。
  • 準備した indexer を使って数値インデックス列を作成します。
  • 同じ手順を org 列にも繰り返します。