Trouver le séparateur à marge maximale
Rappelez-vous que le jeu de données que nous utilisons contient les mesures de teneur en sucre de 25 échantillons choisis aléatoirement pour deux boissons gazeuses, l’une classique et l’autre à teneur réduite en sucre. Dans l’un de nos premiers graphiques, nous avons identifié deux groupes (classes) distincts. Un jeu de données dans lequel les classes ne se chevauchent pas est dit séparable, les classes étant séparées par une frontière de décision. Le séparateur à marge maximale est la frontière de décision la plus éloignée des deux classes. Il se situe à la moyenne des points extrêmes pertinents de chaque classe. Dans ce cas, les points pertinents sont la valeur la plus élevée dans la classe à faible teneur en sucre et la valeur la plus faible dans la classe à forte teneur en sucre. Dans cet exercice, vous allez déterminer le séparateur à marge maximale pour le jeu de données sur la teneur en sucre.
Cet exercice fait partie du cours
Machines à vecteurs de support en R
Instructions
- Trouvez le séparateur à marge maximale et affectez-le à la variable
mm_separator. - Utilisez le graphique affiché pour relever les valeurs de teneur en sucre des points de données extrêmes pertinents dans chaque classe.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
#The maximal margin separator is at the midpoint of the two extreme points in each cluster.
mm_separator <- (___ + ___)/2