T-shirtmaten encoden
Je hebt gegevens voor een zending T-shirts. De data bevat de maat van het shirt: S, M, L of XL.
Hier zijn de aantallen per maat:
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
De maten worden eerst met StringIndexer omgezet naar een index en daarna one-hot geëncodet met OneHotEncoder.
Welke van de volgende uitspraken is niet waar:
Deze oefening maakt deel uit van de cursus
Machine Learning met PySpark
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen