Validação cruzada com R-quadrado
A validação cruzada é uma abordagem vital para a avaliação de um modelo. Ela maximiza a quantidade de dados disponíveis para o modelo, pois o modelo não é apenas treinado, mas também testado com todos os dados disponíveis.
Neste exercício, você deve criar um modelo de regressão linear e, em seguida, usar a validação cruzada com 6 grupos (6 folds) para avaliar sua precisão na previsão de vendas usando gastos com publicidade em redes sociais. Você deve exibir a pontuação individual de cada um dos seis grupos.
O conjunto de dados sales_df
foi dividido em y
para a variável dependente e X
para as variáveis independentes e já foi pré-carregado para você. LinearRegression
foi importado de sklearn.linear_model
.
Este exercício faz parte do curso
Aprendizado Supervisionado com o scikit-learn
Instruções do exercício
- Importe
KFold
ecross_val_score
. - Crie
kf
chamandoKFold()
, definindo o número de divisões como seis,shuffle
comoTrue
e definindo uma semente igual a5
. - Faça a validação cruzada usando
reg
comX
ey
, passandokf
emcv
. - Imprima
cv_scores
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)