Operador
En este ejercicio crearás un StringIndexer
y un OneHotEncoder
para codificar la columna carrier
. Para ello, llamarás a los constructores de la clase con los argumentos inputCol
y outputCol
.
El inputCol
es el nombre de la columna que quieres indexar o codificar, y el outputCol
es el nombre de la nueva columna que debe crear el Transformer
.
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Crea un
StringIndexer
llamadocarr_indexer
llamando aStringIndexer()
coninputCol="carrier"
youtputCol="carrier_index"
. - Crea un
OneHotEncoder
llamadocarr_encoder
llamando aOneHotEncoder()
coninputCol="carrier_index"
youtputCol="carrier_fact"
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)