ComeçarComece de graça

Abordagem do conjunto de validação

No capítulo sobre regressão linear, você ajustou um modelo de regressão que explica os pesos do coração dos gatos pelos seus pesos corporais. O entrevistador pede que você avalie quão bom é o seu modelo.

Para responder a essa pergunta, você precisa gerar previsões que possam ser comparadas com os valores reais. Na abordagem do conjunto de validação, você divide seus dados em duas partes.

Para isso, você pode primeiro tirar uma amostra de, digamos, 80% dos números das linhas. Use os números de linha escolhidos para criar o subconjunto de treino. O restante do data frame pode ser usado para teste.

Lembre-se de que:

rows <- c(1, 3)
df[-rows, ]

seleciona o subconjunto com todas, exceto a primeira e a terceira linha.

O conjunto de dados cats está disponível no seu ambiente.

Este exercício faz parte do curso

Praticando perguntas de entrevista de Estatística em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

set.seed(123)

# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))
Editar e executar o código