Convalida incrociata per l'R-squared
La convalida incrociata è un approccio fondamentale per valutare un modello. Questo metodo massimizza la quantità di dati disponibili per il modello, in quanto il modello non solo viene addestrato ma anche testato su tutti i dati disponibili.
In questo esercizio costruirai un modello di regressione lineare e poi userai una convalida incrociata di 6 volte per valutarne l'accuratezza nel prevedere le vendite con la spesa pubblicitaria sui social media. Verrà visualizzato il punteggio individuale per ciascuna delle sei pieghe.
Il set di dati sales_df è stato suddiviso in y per la variabile target e X per le caratteristiche e precaricato per te. LinearRegression è stato importato da sklearn.linear_model.
Questo esercizio fa parte del corso
Apprendimento supervisionato con scikit-learn
Istruzioni dell'esercizio
- Importazione di
KFoldecross_val_score. - Crea
kfchiamandoKFold(), impostando il numero di split a sei,shuffleaTrue, e impostando un seme di5. - Esegui una convalida incrociata utilizzando
regsuXey, passandokfacv. - Stampa il sito
cv_scores.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the necessary modules
from ____.____ import ____, ____
# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)
reg = LinearRegression()
# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)
# Print scores
print(____)