Zoek de scheider met maximale marge
Onthoud dat de gegevensset waar we mee werken bestaat uit metingen van het suikergehalte van 25 willekeurig gekozen monsters van twee frisdranken: één regulier en één met minder suiker. In een van onze eerdere grafieken zagen we twee duidelijke clusters (klassen). Een gegevensset waarin de klassen niet overlappen noemen we separabel; de klassen worden gescheiden door een beslissingsgrens. De scheider met maximale marge is de beslissingsgrens die het verst van beide klassen ligt. Deze ligt op het gemiddelde van de relevante extreme punten uit elke klasse. In dit geval zijn de relevante punten: de hoogste waarde in de klasse met laag suikergehalte en de laagste waarde in de klasse met hoog suikergehalte. In deze oefening zoek je de scheider met maximale marge voor de gegevensset met suikergehalten.
Deze oefening maakt deel uit van de cursus
Support Vector Machines in R
Oefeninstructies
- Zoek de scheider met maximale marge en sla deze op in de variabele
mm_separator. - Gebruik de getoonde grafiek om de suikergehaltewaarden van de relevante extreme punten in elke klasse te vinden.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
#The maximal margin separator is at the midpoint of the two extreme points in each cluster.
mm_separator <- (___ + ___)/2