Hemdengrößen kodieren
Du hast Daten für eine Sendung von T-Shirts. Zu den Daten gehört auch die Größe des Shirts, die entweder als S, M, L oder XL angegeben wird.
Hier sind die Zahlen für die verschiedenen Größen:
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
Die Größen werden zunächst mit StringIndexer in einen Index umgewandelt und dann mit OneHotEncoder in einen One-Hot-Code umgewandelt.
Welche der folgenden Aussagen trifft nicht zu?
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten