Carrier
Dalam latihan ini, Anda akan membuat StringIndexer dan OneHotEncoder untuk mengodekan kolom carrier. Untuk melakukannya, Anda akan memanggil konstruktor kelas dengan argumen inputCol dan outputCol.
inputCol adalah nama kolom yang ingin Anda indeks atau kodekan, dan outputCol adalah nama kolom baru yang harus dibuat oleh Transformer.
Latihan ini merupakan bagian dari kursus
Dasar-Dasar PySpark
Instruksi latihan
- Buat
StringIndexerbernamacarr_indexerdengan memanggilStringIndexer()menggunakaninputCol="carrier"danoutputCol="carrier_index". - Buat
OneHotEncoderbernamacarr_encoderdengan memanggilOneHotEncoder()menggunakaninputCol="carrier_index"danoutputCol="carrier_fact".
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)