Transporteur
Dans cet exercice, vous créerez un StringIndexer et un OneHotEncoder pour coder la colonne carrier. Pour ce faire, vous appellerez les constructeurs de la classe avec les arguments inputCol et outputCol.
inputCol est le nom de la colonne que vous souhaitez indexer ou encoder, et outputCol est le nom de la nouvelle colonne que Transformer doit créer.
Cet exercice fait partie du cours
<cours>Introduction à PySpark</cours>Instructions de l’exercice
- Créez un site
StringIndexerappelécarr_indexeren appelantStringIndexer()avecinputCol="carrier"etoutputCol="carrier_index". - Créez un site
OneHotEncoderappelécarr_encoderen appelantOneHotEncoder()avecinputCol="carrier_index"etoutputCol="carrier_fact".
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Create a StringIndexer
carr_indexer = StringIndexer(____)
# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)