Tester d'autres valeurs "k
Par défaut, la fonction knn()
du paquetage class
n'utilise que le plus proche voisin.
La définition d'un paramètre k
permet à l'algorithme de prendre en compte d'autres voisins proches. Cela permet d'élargir la collection de voisins qui voteront pour la classe prédite.
Comparez les valeurs k
de 1, 7 et 15 pour examiner l'impact sur la précision de la classification des panneaux de signalisation.
Le paquet class
est déjà chargé dans votre espace de travail avec les ensembles de données signs
, signs_test
et sign_types
. L'objet signs_actual
contient les vraies valeurs des signes.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Instructions
- Calculez la précision du modèle par défaut
k = 1
en utilisant le code donné, puis trouvez la précision du modèle en utilisantmean()
pour comparersigns_actual
et les prédictions du modèle. - Modifiez l'appel à la fonction
knn()
en définissantk = 7
et trouvez à nouveau la valeur de la précision. - Révisez le code une fois de plus en réglant
k = 15
, et trouvez la valeur de précision une fois de plus.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the accuracy of the baseline model (default k = 1)
k_1 <- knn(train = ___, test = ___, cl = ___)
mean(___)
# Modify the above to set k = 7
k_7 <- ___
mean(___)
# Set k = 15 and compare to the above
k_15 <- ___
mean(___)