Iris redux - een robuustere nauwkeurigheid.

In deze oefening bouw je lineaire SVM's voor 100 verschillende training/test-partities van de iris-gegevensset. Vervolgens beoordeel je de prestaties van je model door de gemiddelde nauwkeurigheid en standaarddeviatie te berekenen. Deze werkwijze, die vrij algemeen is, geeft je een veel robuustere maat voor modelprestaties dan de maat die je uit één enkele partitie krijgt.

Deze oefening maakt deel uit van de cursus

Support Vector Machines in R

Oefeninstructies

Voor elke iteratie:
- Verdeel de gegevensset willekeurig in een training- en testset met een 80/20-split.
- Bouw een lineaire SVM met standaardkosten op de trainingsgegevensset.
- Beoordeel de nauwkeurigheid van je model (accuracy is al geïnitialiseerd in je omgeving).

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

for (i in 1:___){
  	#assign 80% of the data to the training set
    sample_size <- ___(___ * nrow(iris))
 	train <- ___(seq_len(nrow(iris)), size = ___)
    trainset <- iris[train, ]
	testset <- iris[-train, ]
  	#build model using training data
    svm_model <- svm(Species~ ., data = ___, 
                     type = "C-classification", kernel = "linear")
  	#calculate accuracy on test data
    pred_test <- predict(svm_model, ___)
    accuracy[i] <- mean(pred_test == ___$Species)
}
mean(___) 
sd(___)

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Support Vector Machines in R

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

Dit hoofdstuk introduceert enkele kernconcepten van support vector machines aan de hand van een eenvoudig eendimensionaal voorbeeld. Je maakt ook stap voor stap een lineair scheidbare gegevensset aan die in het volgende hoofdstuk wordt gebruikt.

Exercise 1: Suikergehalte van frisdranken Exercise 2: Een gegevensset met suikergehalte visualiseren Exercise 3: Beslissingsgrenzen herkennen Exercise 4: Zoek de scheider met maximale marge Exercise 5: Visualiseer de maximalemarge-scheider Exercise 6: Een lineair te scheiden gegevensset genereren Exercise 7: Genereer een 2D uniform verdeelde gegevensset.Exercise 8: Maak een beslissingsgrens Exercise 9: Voeg een marge toe aan de gegevensset

Maakt je vertrouwd met de basisconcepten van support vector machines door het svm-algoritme toe te passen op een lineair scheidbare gegevensset. Belangrijke concepten worden geïllustreerd met ggplot-visualisaties die zijn opgebouwd uit de resultaten van het algoritme, en de rol van de cost-parameter wordt uitgelicht met een eenvoudig voorbeeld. Het hoofdstuk sluit af met een sectie over hoe het algoritme met multiclass-problemen omgaat.

Exercise 1: Lineaire Support Vector Machines Exercise 2: Trainings- en testgegevenssets maken Exercise 3: Een lineaire SVM-classifier bouwen Exercise 4: Het model verkennen en de nauwkeurigheid berekenen Exercise 5: Lineaire SVM's visualiseren Exercise 6: Support vectors visualiseren met ggplot Exercise 7: Beslissings- en margegrenzen visualiseren met `ggplot2`Exercise 8: Beslissings- en margeranden visualiseren met `plot()`Exercise 9: Lineaire SVM's afstemmen Exercise 10: Afstemmen van een lineaire SVM Exercise 11: Beslisgrenzen en marges visualiseren Exercise 12: Wanneer zijn soft-margin-classifiers nuttig?Exercise 13: Multiklasse-problemen Exercise 14: Een multiclass-classificatieprobleem Exercise 15: Iris redux - een robuustere nauwkeurigheid.

Huidige oefening

Biedt een introductie tot polynomiale kernels via een radiaal scheidbare gegevensset (dus met een cirkelvormige beslissingsgrens). Nadat is laten zien dat lineaire kernels voor deze gegevensset tekortschieten, zie je hoe een eenvoudige transformatie het probleem lineair scheidbaar maakt, wat motiveert tot een intuïtieve bespreking van de kernel-truc. Vervolgens pas je de polynomiale kernel toe op de gegevensset en stem je de resulterende classifier af.

Exercise 1: Een radiaal scheidbare gegevensset genereren Exercise 2: Een 2D radiaal scheidbare gegevensset genereren Exercise 3: De gegevensset visualiseren Exercise 4: Lineaire SVM's op radiaal scheidbare data Exercise 5: Lineaire SVM voor een radiaal scheidbare gegevensset Exercise 6: Gemiddelde nauwkeurigheid voor lineaire SVM Exercise 7: De kerneltruc Exercise 8: Getransformeerde radiaal-separeerbare data visualiseren Exercise 9: SVM met polynomiale kernel Exercise 10: SVM's afstemmen Exercise 11: `tune.svm()` gebruiken Exercise 12: Het getunede model bouwen en visualiseren

Bouwt voort op de vorige drie hoofdstukken door de zeer flexibele Radial Basis Function (RBF)-kernel te introduceren. Je maakt een "complexe" gegevensset die de beperkingen van polynomiale kernels blootlegt. Daarna, na een intuïtieve motivatie voor de RBF-kernel, zie je hoe deze de tekortkomingen van de andere kernels in deze cursus aanpakt.

Exercise 1: Een complexe gegevensset genereren Exercise 2: Een complexe gegevensset genereren - deel 1 Exercise 3: Een complexe gegevensset genereren - deel 2 Exercise 4: De gegevensset visualiseren Exercise 5: Motivatie voor de RBF-kernel Exercise 6: Lineaire SVM voor complexe gegevensset Exercise 7: Kwadratische SVM voor complexe gegevensset Exercise 8: De RBF-kernel Exercise 9: Polynomiale SVM op een complexe gegevensset Exercise 10: RBF-SVM op een complex gegevensset Exercise 11: Afstemmen van een RBF-kernel SVM