ComeçarComece de graça

Crie um plano de validação cruzada

Há várias formas de implementar um plano de validação cruzada em n partes (n-fold). Neste exercício, você vai criar esse plano usando vtreat::kWayCrossValidation() e examiná-lo.

kWayCrossValidation() cria um plano de validação cruzada com a seguinte chamada:

splitPlan <- kWayCrossValidation(nRows, nSplits, dframe, y)

em que nRows é o número de linhas dos dados a serem divididos, e nSplits é o número desejado de partes (folds) na validação cruzada.

Tecnicamente, dframe e y não são usados por kWayCrossValidation; eles existem para compatibilidade com outras funções de particionamento de dados do vtreat. Você pode definir ambos como NULL.

O splitPlan resultante é uma lista com nSplits elementos; cada elemento contém dois vetores:

  • train: os índices de dframe que formarão o conjunto de treino
  • app: os índices de dframe que formarão o conjunto de teste (ou de aplicação)

Neste exercício, você vai criar um plano de validação cruzada com 3 folds para o conjunto de dados mpg.

Este exercício faz parte do curso

Aprendizado Supervisionado em R: Regressão

Ver curso

Instruções do exercício

  • Carregue o pacote vtreat.
  • Obtenha o número de linhas em mpg e atribua à variável nRows.
  • Chame kWayCrossValidation para criar um plano de validação cruzada com 3 folds e atribua à variável splitPlan.
    • Você pode definir os dois últimos argumentos da função como NULL.
  • Chame str() para examinar a estrutura de splitPlan.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load the package vtreat
___

# mpg is available
summary(mpg)

# Get the number of rows in mpg
nRows <- ___

# Implement the 3-fold cross-fold plan with vtreat
splitPlan <- ___

# Examine the split plan
___
Editar e executar o código