Tester d'autres valeurs "k
Par défaut, la fonction knn() du paquetage class n'utilise que le plus proche voisin.
La définition d'un paramètre k permet à l'algorithme de prendre en compte d'autres voisins proches. Cela permet d'élargir la collection de voisins qui voteront pour la classe prédite.
Comparez les valeurs k de 1, 7 et 15 pour examiner l'impact sur la précision de la classification des panneaux de signalisation.
Le paquet class est déjà chargé dans votre espace de travail avec les ensembles de données signs, signs_test et sign_types. L'objet signs_actual contient les vraies valeurs des signes.
Cet exercice fait partie du cours
Apprentissage supervisé en R : Classification
Instructions
- Calculez la précision du modèle par défaut
k = 1en utilisant le code donné, puis trouvez la précision du modèle en utilisantmean()pour comparersigns_actualet les prédictions du modèle. - Modifiez l'appel à la fonction
knn()en définissantk = 7et trouvez à nouveau la valeur de la précision. - Révisez le code une fois de plus en réglant
k = 15, et trouvez la valeur de précision une fois de plus.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Compute the accuracy of the baseline model (default k = 1)
k_1 <- knn(train = ___, test = ___, cl = ___)
mean(___)
# Modify the above to set k = 7
k_7 <- ___
mean(___)
# Set k = 15 and compare to the above
k_15 <- ___
mean(___)