ComenzarEmpieza gratis

Operador

En este ejercicio crearás un StringIndexer y un OneHotEncoder para codificar la columna carrier. Para ello, llamarás a los constructores de la clase con los argumentos inputCol y outputCol.

El inputCol es el nombre de la columna que quieres indexar o codificar, y el outputCol es el nombre de la nueva columna que debe crear el Transformer.

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Crea un StringIndexer llamado carr_indexer llamando a StringIndexer() con inputCol="carrier" y outputCol="carrier_index".
  • Crea un OneHotEncoder llamado carr_encoder llamando a OneHotEncoder() con inputCol="carrier_index" y outputCol="carrier_fact".

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Editar y ejecutar código