BaşlayınÜcretsiz başlayın

Carrier

Bu egzersizde carrier sütununu kodlamak için bir StringIndexer ve bir OneHotEncoder oluşturacaksın. Bunu yapmak için sınıf kurucularını inputCol ve outputCol argümanlarıyla çağıracaksın.

inputCol, indekslemek veya kodlamak istediğin sütunun adı; outputCol ise Transformerın oluşturacağı yeni sütunun adı.

Bu egzersiz, kursun bir parçasıdır

PySpark Temelleri

Kursa Göz Atın

Egzersiz talimatları

  • inputCol="carrier" ve outputCol="carrier_index" ile StringIndexer() çağırarak carr_indexer adlı bir StringIndexer oluştur.
  • inputCol="carrier_index" ve outputCol="carrier_fact" ile OneHotEncoder() çağırarak carr_encoder adlı bir OneHotEncoder oluştur.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Kodu Düzenle ve Çalıştır