Crie um plano de validação cruzada
Há várias formas de implementar um plano de validação cruzada em n partes (n-fold). Neste exercício, você vai criar esse plano usando vtreat::kWayCrossValidation() e examiná-lo.
kWayCrossValidation() cria um plano de validação cruzada com a seguinte chamada:
splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)
em que nRows é o número de linhas dos dados a serem divididos, e nSplits é o número desejado de partes (folds) na validação cruzada.
Tecnicamente, dframe e y não são usados por kWayCrossValidation; eles existem para compatibilidade com outras funções de particionamento de dados do vtreat. Você pode definir ambos como NULL.
O splitPlan resultante é uma lista com nSplits elementos; cada elemento contém dois vetores:
train: os índices dedframeque formarão o conjunto de treinoapp: os índices dedframeque formarão o conjunto de teste (ou de aplicação)
Neste exercício, você vai criar um plano de validação cruzada com 3 folds para o conjunto de dados mpg.
Este exercício faz parte do curso
Aprendizado Supervisionado em R: Regressão
Instruções do exercício
- Carregue o pacote
vtreat. - Obtenha o número de linhas em
mpge atribua à variávelnRows. - Chame
kWayCrossValidationpara criar um plano de validação cruzada com 3 folds e atribua à variávelsplitPlan.- Você pode definir os dois últimos argumentos da função como
NULL.
- Você pode definir os dois últimos argumentos da função como
- Chame
str()para examinar a estrutura desplitPlan.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load the package vtreat
___
# mpg is available
summary(mpg)
# Get the number of rows in mpg
nRows <- ___
# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___
# Examine the split plan
___