ComenzarEmpieza gratis

De cero a experto

Has dominado cómo crear la especificación de un modelo y cómo dividir los datos en conjuntos de entrenamiento y prueba. También sabes cómo evitar desequilibrios de clases en la partición. ¡Ahora toca combinar lo que aprendiste en la lección anterior y construir tu modelo usando solo el conjunto de entrenamiento!

Vas a crear un auténtico machine learning pipeline. Esto incluye crear la especificación del modelo, dividir tus datos en entrenamiento y prueba y, por último, pero no menos importante, ajustar el modelo con los datos de entrenamiento. ¡A por ello!

Este ejercicio forma parte del curso

Machine Learning con modelos basados en árboles en R

Ver curso

Instrucciones del ejercicio

  • Crea diabetes_split, una partición donde el conjunto de entrenamiento contenga tres cuartas partes de todas las filas de diabetes y donde los conjuntos de entrenamiento y prueba tengan una distribución similar en la variable outcome.
  • Construye una especificación de árbol de decisión para tu modelo usando el motor rpart y guárdala como tree_spec.
  • Ajusta un modelo model_trained usando los datos de entrenamiento de diabetes_split con outcome como variable objetivo y bmi y skin_thickness como predictores.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

set.seed(9)

# Create the balanced data split
diabetes_split <- ___

# Build the specification of the model
tree_spec <- ___ %>% 
  ___ %>% 
  ___

# Train the model
model_trained <- ___ %>% 
  fit(___, 
      ___)

model_trained
Editar y ejecutar código