Exploration de l'ensemble de données sur les panneaux de signalisation
Pour mieux comprendre comment la fonction knn()
a pu classer le panneau d'arrêt, il peut être utile d'examiner l'ensemble de données d'apprentissage qu'elle a utilisé.
Chaque plaque de rue observée précédemment a été divisée en une grille de 4 x 4, et les niveaux de rouge, de vert et de bleu pour chacun des 16 pixels centraux ont été enregistrés comme illustré ici.
Le résultat est un ensemble de données qui enregistre le site sign_type
ainsi que 16 x 3 = 48 propriétés de couleur de chaque panneau.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Instructions
- Utilisez la fonction
str()
pour examiner l'ensemble de donnéessigns
. - Utilisez
table()
pour compter le nombre d'observations de chaque type de signe en lui transmettant la colonne contenant les étiquettes. - Exécutez la commande
aggregate()
fournie pour voir si le niveau moyen de rouge peut varier en fonction du type de panneau.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Examine the structure of the signs dataset
# Count the number of signs of each type
table(___)
# Check r10's average red level by sign type
aggregate(r10 ~ sign_type, data = signs, mean)