Codificação dos tamanhos das camisetas
Você tem os dados de uma remessa de camisetas. Os dados incluem o tamanho da camisa, que é dado como P, M, G ou GG.
Aqui estão as contagens para os diferentes tamanhos:
+----+-----+
|size|count|
+----+-----+
| S| 8|
| M| 15|
| L| 20|
| XL| 7|
+----+-----+
Os tamanhos são primeiro convertidos para um índice usando StringIndexer
e, em seguida, codificados como one-hot usando OneHotEncoder
.
Qual das opções a seguir não é verdadeira?
Este exercício faz parte do curso
Machine Learning com PySpark
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
