Carrier
Bu egzersizde carrier sütununu kodlamak için bir StringIndexer ve bir OneHotEncoder oluşturacaksın. Bunu yapmak için sınıf kurucularını inputCol ve outputCol argümanlarıyla çağıracaksın.
inputCol, indekslemek veya kodlamak istediğin sütunun adı; outputCol ise Transformerın oluşturacağı yeni sütunun adı.
Bu egzersiz
PySpark Temelleri
kursunun bir parçasıdırEgzersiz talimatları
inputCol="carrier"veoutputCol="carrier_index"ileStringIndexer()çağırarakcarr_indexeradlı birStringIndexeroluştur.inputCol="carrier_index"veoutputCol="carrier_fact"ileOneHotEncoder()çağırarakcarr_encoderadlı birOneHotEncoderoluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)