CommencerCommencer gratuitement

Exploration de l'ensemble de données sur les panneaux de signalisation

Pour mieux comprendre comment la fonction knn() a pu classer le panneau d'arrêt, il peut être utile d'examiner l'ensemble de données d'apprentissage qu'elle a utilisé.

Chaque plaque de rue observée précédemment a été divisée en une grille de 4 x 4, et les niveaux de rouge, de vert et de bleu pour chacun des 16 pixels centraux ont été enregistrés comme illustré ici.

Encodage des données des panneaux d'arrêt

Le résultat est un ensemble de données qui enregistre le site sign_type ainsi que 16 x 3 = 48 propriétés de couleur de chaque panneau.

Cet exercice fait partie du cours

Apprentissage supervisé en R : Classification

Afficher le cours

Instructions

  • Utilisez la fonction str() pour examiner l'ensemble de données signs.
  • Utilisez table() pour compter le nombre d'observations de chaque type de signe en lui transmettant la colonne contenant les étiquettes.
  • Exécutez la commande aggregate() fournie pour voir si le niveau moyen de rouge peut varier en fonction du type de panneau.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Examine the structure of the signs dataset


# Count the number of signs of each type
table(___)

# Check r10's average red level by sign type
aggregate(r10 ~ sign_type, data = signs, mean)
Modifier et exécuter le code