Explorando o conjunto de dados de sinais de trânsito
Para entender melhor como a função knn()
foi capaz de classificar o sinal de parada, pode ser útil examinar o conjunto de dados de treinamento que ela usou.
Cada placa de rua observada anteriormente foi dividida em uma grade 4x4, e os níveis de vermelho, verde e azul de cada um dos 16 pixels centrais foram registrados conforme ilustrado aqui.
O resultado é um conjunto de dados que registra o sign_type
, bem como 16 x 3 = 48 propriedades de cor de cada sinal.
Este exercício faz parte do curso
Aprendizagem supervisionada em R: Classificação
Instruções do exercício
- Use a função
str()
para examinar o conjunto de dadossigns
. - Use o site
table()
para contar o número de observações de cada tipo de sinal, passando a ele a coluna que contém os rótulos. - Execute o comando
aggregate()
fornecido para ver se o nível médio de vermelho pode variar de acordo com o tipo de sinal.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Examine the structure of the signs dataset
# Count the number of signs of each type
table(___)
# Check r10's average red level by sign type
aggregate(r10 ~ sign_type, data = signs, mean)