ComeçarComece de graça

Companhia aérea

Neste exercício, você vai criar um StringIndexer e um OneHotEncoder para codificar a coluna carrier. Para fazer isso, você deve chamar os construtores de classe com os argumentos inputCol e outputCol.

inputCol é o nome da coluna que você deseja indexar ou codificar, e outputCol é o nome da nova coluna que o Transformer deve criar.

Este exercício faz parte do curso

Introdução ao PySpark

Ver curso

Instruções do exercício

  • Crie um StringIndexer chamado carr_indexer chamando StringIndexer() com inputCol="carrier" e outputCol="carrier_index".
  • Crie um OneHotEncoder chamado carr_encoder chamando OneHotEncoder() com inputCol="carrier_index" e outputCol="carrier_fact".

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Editar e executar o código