Iris, version 2 : une précision plus robuste.

Dans cet exercice, vous allez entraîner des SVM linéaires pour 100 partitions apprentissage/test distinctes du jeu de données iris. Vous évaluerez ensuite les performances de votre modèle en calculant la précision moyenne et l’écart-type. Cette procédure, assez générale, vous donnera une mesure bien plus robuste des performances du modèle que celle obtenue à partir d’une seule partition.

Cet exercice fait partie du cours

<cours>Machines à vecteurs de support en R</cours>

Instructions de l’exercice

Pour chaque itération :
- Partitionnez le jeu de données en ensembles d’entraînement et de test selon un découpage aléatoire 80/20.
- Entraînez un SVM linéaire avec le coût par défaut sur l’ensemble d’entraînement.
- Évaluez la précision de votre modèle (accuracy a été initialisée dans votre environnement).

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

for (i in 1:___){
  	#assign 80% of the data to the training set
    sample_size <- ___(___ * nrow(iris))
 	train <- ___(seq_len(nrow(iris)), size = ___)
    trainset <- iris[train, ]
	testset <- iris[-train, ]
  	#build model using training data
    svm_model <- svm(Species~ ., data = ___, 
                     type = "C-classification", kernel = "linear")
  	#calculate accuracy on test data
    pred_test <- predict(svm_model, ___)
    accuracy[i] <- mean(pred_test == ___$Species)
}
mean(___) 
sd(___)

Modifier et exécuter le code

Cet exercice fait partie du cours

<cours>Machines à vecteurs de support en R</cours>

IntermédiaireNiveau de compétence

4.8+

Commencer le cours gratuitement

Ce chapitre présente des concepts clés des machines à vecteurs de support au moyen d’un exemple simple à une dimension. Vous serez également guidé pas à pas pour créer un jeu de données linéairement séparables qui sera utilisé au chapitre suivant.

Exercise 1: Teneur en sucre des sodas Exercise 2: Visualiser un jeu de données sur la teneur en sucre Exercise 3: Identifier les frontières de décision Exercise 4: Trouver le séparateur à marge maximale Exercise 5: Visualiser le séparateur à marge maximale Exercise 6: Générer un jeu de données linéairement séparable Exercise 7: Générer un jeu de données bidimensionnel à distribution uniforme.Exercise 8: Créer une frontière de décision Exercise 9: Introduire une marge dans le jeu de données

Présente les notions de base des machines à vecteurs de support en appliquant l’algorithme svm à un jeu de données linéairement séparables. Les concepts essentiels sont illustrés par des visualisations ggplot construites à partir des sorties de l’algorithme, et le rôle du paramètre de coût est mis en avant via un exemple simple. Le chapitre se termine par une section sur la manière dont l’algorithme gère les problèmes multiclasse.

Exercise 1: Machines à vecteurs de support linéaires Exercise 2: Créer des jeux d’entraînement et de test Exercise 3: Construire un classifieur SVM linéaire Exercise 4: Explorer le modèle et calculer la précision Exercise 5: Visualiser les SVM linéaires Exercise 6: Visualiser les vecteurs de support avec ggplot Exercise 7: Visualiser les frontières de décision et de marge avec `ggplot2`Exercise 8: Visualiser les frontières de décision et de marge avec `plot()`Exercise 9: Ajuster les SVM linéaires Exercise 10: Ajuster un SVM linéaire Exercise 11: Visualiser les frontières de décision et les marges Exercise 12: Dans quels cas les classificateurs à marge souple sont-ils utiles ?Exercise 13: Problèmes multiclasse Exercise 14: Un problème de classification multiclasse Exercise 15: Iris, version 2 : une précision plus robuste.

Exercice actuel

Propose une introduction aux noyaux polynomiaux à partir d’un jeu de données radialement séparables (c’est-à-dire avec une frontière de décision circulaire). Après avoir montré l’insuffisance des noyaux linéaires pour ce jeu de données, vous verrez comment une transformation simple rend le problème linéairement séparable, ce qui motive une explication intuitive de l’astuce du noyau. Vous appliquerez ensuite le noyau polynomial au jeu de données et réglerez le classifieur obtenu.

Exercise 1: Générer un jeu de données radialement séparable Exercise 2: Générer un jeu de données 2D radialement séparable Exercise 3: Visualiser le jeu de données Exercise 4: SVM linéaires sur des données radialement séparables Exercise 5: SVM linéaire pour un jeu de données radialement séparable Exercise 6: Précision moyenne pour un SVM linéaire Exercise 7: L’astuce du noyau Exercise 8: Visualiser des données radialement séparables après transformation Exercise 9: SVM avec noyau polynomial Exercise 10: Ajuster les SVM Exercise 11: Utiliser `tune.svm()`Exercise 12: Construire et visualiser le modèle optimisé

S’appuie sur les trois chapitres précédents pour présenter le noyau à fonction de base radiale (RBF), très flexible. Vous créerez un jeu de données « complexe » qui met en évidence les limites des noyaux polynomiaux. Puis, après une motivation intuitive du noyau RBF, vous verrez comment il corrige les insuffisances des autres noyaux abordés dans ce cours.

Exercise 1: Générer un jeu de données complexe Exercise 2: Générer un jeu de données complexe - partie 1 Exercise 3: Générer un jeu de données complexe - partie 2 Exercise 4: Visualiser le jeu de données Exercise 5: Motiver le noyau RBF Exercise 6: SVM linéaire pour un jeu de données complexe Exercise 7: SVM quadratique pour un jeu de données complexe Exercise 8: Le noyau RBF Exercise 9: SVM polynomial sur un jeu de données complexe Exercise 10: SVM à noyau RBF sur un jeu de données complexe Exercise 11: Ajuster un SVM à noyau RBF