LoslegenKostenlos loslegen

Codierung der Hemdgrößen

Du hast Daten für eine Lieferung von T-Shirts. Die Daten umfassen die Größe des Shirts, die entweder mit S, M, L oder XL angegeben wird.

Hier sind die Zahlen für die verschiedenen Größen:

+----+-----+
|size|count|
+----+-----+
|   S|    8|
|   M|   15|
|   L|   20|
|  XL|    7|
+----+-----+

Die Größen werden erst mit „ StringIndexer “ in einen Index umgewandelt und dann mit „ OneHotEncoder “ one-hot-codiert.

Was stimmt nicht?

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit PySpark

Kurs anzeigen

Interaktive Übung

In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.

Übung starten