Transporteur
Dans cet exercice, vous créerez un StringIndexer et un OneHotEncoder pour coder la colonne carrier. Pour ce faire, vous appellerez les constructeurs de la classe avec les arguments inputCol et outputCol.
inputCol est le nom de la colonne que vous souhaitez indexer ou encoder, et outputCol est le nom de la nouvelle colonne que Transformer doit créer.
Cet exercice fait partie du cours
Introduction à PySpark
Instructions
- Créez un site
StringIndexerappelécarr_indexeren appelantStringIndexer()avecinputCol="carrier"etoutputCol="carrier_index". - Créez un site
OneHotEncoderappelécarr_encoderen appelantOneHotEncoder()avecinputCol="carrier_index"etoutputCol="carrier_fact".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)