Codierung der Hemdgrößen
Du hast Daten für eine Lieferung von T-Shirts. Die Daten umfassen die Größe des Shirts, die entweder mit S, M, L oder XL angegeben wird.
Hier sind die Zahlen für die verschiedenen Größen:
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
Die Größen werden erst mit „ StringIndexer
“ in einen Index umgewandelt und dann mit „ OneHotEncoder
“ one-hot-codiert.
Was stimmt nicht?
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit PySpark
Interaktive Übung
Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um
