Transporteur
Dans cet exercice, vous créerez un StringIndexer
et un OneHotEncoder
pour coder la colonne carrier
. Pour ce faire, vous appellerez les constructeurs de la classe avec les arguments inputCol
et outputCol
.
inputCol
est le nom de la colonne que vous souhaitez indexer ou encoder, et outputCol
est le nom de la nouvelle colonne que Transformer
doit créer.
Cet exercice fait partie du cours
Introduction à PySpark
Instructions
- Créez un site
StringIndexer
appelécarr_indexer
en appelantStringIndexer()
avecinputCol="carrier"
etoutputCol="carrier_index"
. - Créez un site
OneHotEncoder
appelécarr_encoder
en appelantOneHotEncoder()
avecinputCol="carrier_index"
etoutputCol="carrier_fact"
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)