Companhia aérea
Neste exercício, você vai criar um StringIndexer e um OneHotEncoder para codificar a coluna carrier. Para fazer isso, você deve chamar os construtores de classe com os argumentos inputCol e outputCol.
inputCol é o nome da coluna que você deseja indexar ou codificar, e outputCol é o nome da nova coluna que o Transformer deve criar.
Este exercício faz parte do curso
Introdução ao PySpark
Instruções do exercício
- Crie um
StringIndexerchamadocarr_indexerchamandoStringIndexer()cominputCol="carrier"eoutputCol="carrier_index". - Crie um
OneHotEncoderchamadocarr_encoderchamandoOneHotEncoder()cominputCol="carrier_index"eoutputCol="carrier_fact".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)