Den Datensatz zu Verkehrsschildern erkunden
Um besser zu verstehen, wie die Funktion knn() das Stoppschild klassifizieren konnte, hilft es, den verwendeten Trainingsdatensatz zu untersuchen.
Jedes zuvor beobachtete Verkehrsschild wurde in ein 4x4-Raster unterteilt, und der Rot-, Grün- und Blauwert für jedes der 16 mittleren Pixel wurde wie hier dargestellt aufgezeichnet.

Das Ergebnis ist ein Datensatz, der den sign_type sowie 16 x 3 = 48 Farbeigenschaften jedes Schildes erfasst.
Diese Übung ist Teil des Kurses
Überwachtes Lernen in R: Klassifikation
Anleitung zur Übung
- Verwende die Funktion
str(), um den Datensatzsignszu untersuchen. - Verwende
table(), um die Anzahl der Beobachtungen je Schildertyp zu zählen, indem du ihr die Spalte mit den Labels übergibst. - Führe den bereitgestellten
aggregate()-Befehl aus, um zu sehen, ob sich der durchschnittliche Rotwert je Schildertyp unterscheidet.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Examine the structure of the signs dataset
# Count the number of signs of each type
table(___)
# Check r10's average red level by sign type
aggregate(r10 ~ sign_type, data = signs, mean)