Codification des tailles de chemises
Vous disposez des données relatives à une expédition de t-shirts. Les données comprennent la taille du t-shirt, qui est indiquée par S, M, L ou XL.
Voici le nombre de pièces pour les différentes tailles :
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
Les tailles sont d'abord converties en un index à l'aide de StringIndexer
, puis encodées en one-hot à l'aide de OneHotEncoder
.
Laquelle des affirmations suivantes est fausse?
Cet exercice fait partie du cours
Apprentissage automatique avec PySpark
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
