Hemdengrößen kodieren
Du hast Daten für eine Sendung von T-Shirts. Zu den Daten gehört auch die Größe des Shirts, die entweder als S, M, L oder XL angegeben wird.
Hier sind die Zahlen für die verschiedenen Größen:
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
Die Größen werden zunächst mit StringIndexer
in einen Index umgewandelt und dann mit OneHotEncoder
in einen One-Hot-Code umgewandelt.
Welche der folgenden Aussagen trifft nicht zu?
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Interaktive Übung
Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um
