Companhia aérea
Neste exercício, você vai criar um StringIndexer
e um OneHotEncoder
para codificar a coluna carrier
. Para fazer isso, você deve chamar os construtores de classe com os argumentos inputCol
e outputCol
.
inputCol
é o nome da coluna que você deseja indexar ou codificar, e outputCol
é o nome da nova coluna que o Transformer
deve criar.
Este exercício faz parte do curso
Introdução ao PySpark
Instruções do exercício
- Crie um
StringIndexer
chamadocarr_indexer
chamandoStringIndexer()
cominputCol="carrier"
eoutputCol="carrier_index"
. - Crie um
OneHotEncoder
chamadocarr_encoder
chamandoOneHotEncoder()
cominputCol="carrier_index"
eoutputCol="carrier_fact"
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)