Iris de nuevo: una precisión más robusta.

En este ejercicio, vas a construir SVM lineales para 100 particiones distintas de entrenamiento/prueba del conjunto de datos iris. Después evaluarás el rendimiento de tu modelo calculando la precisión media y la desviación estándar. Este procedimiento, bastante general, te dará una medida mucho más robusta del rendimiento del modelo que la obtenida a partir de una única partición.

Este ejercicio forma parte del curso

Máquinas de Vectores de Soporte en R

Instrucciones del ejercicio

Para cada ensayo:
- Divide el conjunto de datos en entrenamiento y prueba con una partición aleatoria 80/20.
- Construye un SVM lineal con coste por defecto sobre el conjunto de entrenamiento.
- Evalúa la precisión de tu modelo (accuracy ya se ha inicializado en tu entorno).

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

for (i in 1:___){
  	#assign 80% of the data to the training set
    sample_size <- ___(___ * nrow(iris))
 	train <- ___(seq_len(nrow(iris)), size = ___)
    trainset <- iris[train, ]
	testset <- iris[-train, ]
  	#build model using training data
    svm_model <- svm(Species~ ., data = ___, 
                     type = "C-classification", kernel = "linear")
  	#calculate accuracy on test data
    pred_test <- predict(svm_model, ___)
    accuracy[i] <- mean(pred_test == ___$Species)
}
mean(___) 
sd(___)

Editar y ejecutar código

Este ejercicio forma parte del curso

Máquinas de Vectores de Soporte en R

IntermedioNivel de habilidad

4.8+

Empieza el curso gratis

Este capítulo presenta algunos conceptos clave de las máquinas de vectores de soporte mediante un ejemplo sencillo de una dimensión. También te guiamos en la creación de un conjunto de datos linealmente separable que se utilizará en el capítulo siguiente.

Exercise 1: Contenido de azúcar en refrescos Exercise 2: Visualizar un conjunto de datos de contenido de azúcar Exercise 3: Identificar fronteras de decisión Exercise 4: Encuentra el separador de margen máximo Exercise 5: Visualiza el separador de margen máximo Exercise 6: Generar un conjunto de datos linealmente separable Exercise 7: Genera un conjunto de datos bidimensional con distribución uniforme.Exercise 8: Crea una frontera de decisión Exercise 9: Introduce un margen en el conjunto de datos

Presenta los conceptos básicos de las máquinas de vectores de soporte aplicando el algoritmo svm a un conjunto de datos linealmente separable. Los conceptos clave se ilustran con visualizaciones de ggplot construidas a partir de los resultados del algoritmo, y se destaca el papel del parámetro de coste con un ejemplo simple. El capítulo cierra con una sección sobre cómo el algoritmo aborda problemas multiclase.

Exercise 1: Máquinas de Vectores de Soporte lineales Exercise 2: Crear conjuntos de entrenamiento y prueba Exercise 3: Crear un clasificador SVM lineal Exercise 4: Explorar el modelo y calcular la exactitud Exercise 5: Visualizar SVM lineales Exercise 6: Visualizar los vectores de soporte con ggplot Exercise 7: Visualizar los límites de decisión y de margen con `ggplot2`Exercise 8: Visualizar las regiones de decisión y los márgenes con `plot()`Exercise 9: Ajuste de SVM lineales Exercise 10: Ajuste fino de un SVM lineal Exercise 11: Visualización de fronteras de decisión y márgenes Exercise 12: ¿Cuándo son útiles los clasificadores de margen blando?Exercise 13: Problemas multiclase Exercise 14: Un problema de clasificación multiclase Exercise 15: Iris de nuevo: una precisión más robusta.

Ejercicio actual

Introduce los kernels polinomiales mediante un conjunto de datos radialmente separable (es decir, con una frontera de decisión circular). Tras mostrar la insuficiencia de los kernels lineales para este conjunto de datos, verás cómo una transformación sencilla vuelve el problema linealmente separable, lo que motiva una explicación intuitiva del kernel trick. Después aplicarás el kernel polinomial al conjunto de datos y ajustarás el clasificador resultante.

Exercise 1: Generar un conjunto de datos radialmente separable Exercise 2: Generar un conjunto de datos 2D radialmente separable Exercise 3: Visualizar el conjunto de datos Exercise 4: SVM lineales con datos separables radialmente Exercise 5: SVM lineal para un conjunto de datos radialmente separable Exercise 6: Precisión media para SVM lineal Exercise 7: El truco del kernel Exercise 8: Visualizar datos radiales transformados Exercise 9: SVM con kernel polinómico Exercise 10: Ajuste de SVMs Exercise 11: Usar `tune.svm()`Exercise 12: Construir y visualizar el modelo ajustado

Amplía los tres capítulos anteriores presentando el kernel de función de base radial (RBF), muy flexible. Crearás un conjunto de datos “complejo” que ponga de manifiesto las limitaciones de los kernels polinomiales. Luego, tras una motivación intuitiva del kernel RBF, verás cómo solventa las carencias de los otros kernels tratados en este curso.

Exercise 1: Generar un conjunto de datos complejo Exercise 2: Generar un conjunto de datos complejo - parte 1 Exercise 3: Generar un conjunto de datos complejo - parte 2 Exercise 4: Visualizar el conjunto de datos Exercise 5: Motivación del kernel RBF Exercise 6: SVM lineal para un conjunto de datos complejo Exercise 7: SVM cuadrático para un conjunto de datos complejo Exercise 8: El kernel RBF Exercise 9: SVM polinómico en un conjunto de datos complejo Exercise 10: SVM con RBF en un conjunto de datos complejo Exercise 11: Ajuste de un SVM con kernel RBF