CommencerCommencer gratuitement

Transporteur

Dans cet exercice, vous créerez un StringIndexer et un OneHotEncoder pour coder la colonne carrier. Pour ce faire, vous appellerez les constructeurs de la classe avec les arguments inputCol et outputCol.

inputCol est le nom de la colonne que vous souhaitez indexer ou encoder, et outputCol est le nom de la nouvelle colonne que Transformer doit créer.

Cet exercice fait partie du cours

Introduction à PySpark

Afficher le cours

Instructions

  • Créez un site StringIndexer appelé carr_indexer en appelant StringIndexer() avec inputCol="carrier" et outputCol="carrier_index".
  • Créez un site OneHotEncoder appelé carr_encoder en appelant OneHotEncoder() avec inputCol="carrier_index" et outputCol="carrier_fact".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Modifier et exécuter le code