Carrier
In questo esercizio creerai uno StringIndexer e un OneHotEncoder per codificare la colonna carrier. Per farlo, chiamerai i costruttori delle classi con gli argomenti inputCol e outputCol.
inputCol è il nome della colonna che vuoi indicizzare o codificare, mentre outputCol è il nome della nuova colonna che il Transformer deve creare.
Questo esercizio fa parte del corso
Fondamenti di PySpark
Istruzioni dell'esercizio
- Crea uno
StringIndexerchiamatocarr_indexerchiamandoStringIndexer()coninputCol="carrier"eoutputCol="carrier_index". - Crea un
OneHotEncoderchiamatocarr_encoderchiamandoOneHotEncoder()coninputCol="carrier_index"eoutputCol="carrier_fact".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)