División train/test
Para evaluar tus modelos, necesitas entrenarlos y probarlos en dos partes distintas del mismo conjunto de datos; de lo contrario, es como copiar en un examen (porque ya conoces las respuestas).
La división de datos es una parte fundamental del proceso de modelado. Ahora vas a practicar esto dividiendo los datos de diabetes y comprobando las proporciones de la división.
Los datos de diabetes del último ejercicio están precargados en tu espacio de trabajo.
Este ejercicio forma parte del curso
Machine Learning con modelos basados en árboles en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create the split
diabetes_split <- ___(___, prop = ___)
# Print the data split
___