Codificación de tallas de camisetas
Tienes datos sobre un envío de camisetas. Los datos incluyen la talla de la camiseta, que se indica como S, M, L o XL.
Aquí están los recuentos para los diferentes tamaños:
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
Los tamaños se convierten primero a un índice utilizando StringIndexer
y, a continuación, se codifican con codificación one-hot utilizando OneHotEncoder
.
¿Cuál de las siguientes afirmaciones no es cierta?
Este ejercicio forma parte del curso
Machine learning con PySpark
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
