Validación cruzada para r_squared
La validación cruzada es un enfoque vital para evaluar un modelo. Maximiza la cantidad de datos de que dispone el modelo, ya que éste no solo se entrena, sino que también se prueba con todos los datos disponibles.
En este ejercicio, construirás un modelo de regresión lineal y, a continuación, utilizarás la validación cruzada a 6 para evaluar su precisión a la hora de predecir las ventas mediante el gasto en publicidad en redes sociales. Visualizarás la puntuación individual de cada uno de los seis pliegues.
El conjunto de datos sales_df
se ha dividido en y
para la variable objetivo, y X
para las características, y se ha precargado para ti. LinearRegression
se ha importado de sklearn.linear_model
.
Este ejercicio forma parte del curso
Aprendizaje supervisado con scikit-learn
Instrucciones del ejercicio
- Importa
KFold
ycross_val_score
. - Crea
kf
llamando aKFold()
, fijando el número de divisiones en seis,shuffle
enTrue
, y fijando una semilla en5
. - Realiza una validación cruzada utilizando
reg
enX
yy
, pasandokf
acv
. - Imprime la página
cv_scores
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)