Carrier
Dalam latihan ini, Anda akan membuat StringIndexer dan OneHotEncoder untuk mengodekan kolom carrier. Untuk melakukannya, Anda akan memanggil konstruktor kelas dengan argumen inputCol dan outputCol.
inputCol adalah nama kolom yang ingin Anda indeks atau kodekan, dan outputCol adalah nama kolom baru yang harus dibuat oleh Transformer.
Latihan ini adalah bagian dari kursus
Dasar-Dasar PySpark
Petunjuk latihan
- Buat
StringIndexerbernamacarr_indexerdengan memanggilStringIndexer()menggunakaninputCol="carrier"danoutputCol="carrier_index". - Buat
OneHotEncoderbernamacarr_encoderdengan memanggilOneHotEncoder()menggunakaninputCol="carrier_index"danoutputCol="carrier_fact".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)