Codificação de tamanhos de camisetas
Você tem dados para uma remessa de camisetas. Os dados incluem o tamanho da camiseta, que é indicado como S, M, L ou XL.
Aqui estão as contagens para os diferentes tamanhos:
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
Os tamanhos são primeiramente convertidos em um índice usando StringIndexer
e, em seguida, codificados em um único instante usando OneHotEncoder
.
Qual das opções a seguir não é verdadeira?
Este exercício faz parte do curso
Aprendizado de máquina com PySpark
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
