MulaiMulai sekarang secara gratis

Carrier

Dalam latihan ini, Anda akan membuat StringIndexer dan OneHotEncoder untuk mengodekan kolom carrier. Untuk melakukannya, Anda akan memanggil konstruktor kelas dengan argumen inputCol dan outputCol.

inputCol adalah nama kolom yang ingin Anda indeks atau kodekan, dan outputCol adalah nama kolom baru yang harus dibuat oleh Transformer.

Latihan ini adalah bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Petunjuk latihan

  • Buat StringIndexer bernama carr_indexer dengan memanggil StringIndexer() menggunakan inputCol="carrier" dan outputCol="carrier_index".
  • Buat OneHotEncoder bernama carr_encoder dengan memanggil OneHotEncoder() menggunakan inputCol="carrier_index" dan outputCol="carrier_fact".

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Edit dan Jalankan Kode