LoslegenKostenlos loslegen

Codierung der Hemdgrößen

Du hast Daten für eine Lieferung von T-Shirts. Die Daten umfassen die Größe des Shirts, die entweder mit S, M, L oder XL angegeben wird.

Hier sind die Zahlen für die verschiedenen Größen:

+----+-----+
|size|count|
+----+-----+
|   S|    8|
|   M|   15|
|   L|   20|
|  XL|    7|
+----+-----+

Die Größen werden erst mit „ StringIndexer “ in einen Index umgewandelt und dann mit „ OneHotEncoder “ one-hot-codiert.

Was stimmt nicht?

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit PySpark

Kurs anzeigen

Interaktive Übung

Setze die Theorie in einer unserer interaktiven Übungen in die Praxis um

Übung starten