CommencerCommencer gratuitement

Codification des tailles de chemises

Vous disposez des données relatives à une expédition de t-shirts. Les données comprennent la taille du t-shirt, qui est indiquée par S, M, L ou XL.

Voici le nombre de pièces pour les différentes tailles :

+----+-----+
|size|count|
+----+-----+
|   S|    8|
|   M|   15|
|   L|   20|
|  XL|    7|
+----+-----+

Les tailles sont d'abord converties en un index à l'aide de StringIndexer, puis encodées en one-hot à l'aide de OneHotEncoder.

Laquelle des affirmations suivantes est fausse?

Cet exercice fait partie du cours

Apprentissage automatique avec PySpark

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice