Operador
En este ejercicio crearás un StringIndexer y un OneHotEncoder para codificar la columna carrier. Para ello, llamarás a los constructores de la clase con los argumentos inputCol y outputCol.
El inputCol es el nombre de la columna que quieres indexar o codificar, y el outputCol es el nombre de la nueva columna que debe crear el Transformer.
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Crea un
StringIndexerllamadocarr_indexerllamando aStringIndexer()coninputCol="carrier"youtputCol="carrier_index". - Crea un
OneHotEncoderllamadocarr_encoderllamando aOneHotEncoder()coninputCol="carrier_index"youtputCol="carrier_fact".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)