IniziaInizia gratis

Convalida incrociata per l'R-squared

La convalida incrociata è un approccio fondamentale per valutare un modello. Questo metodo massimizza la quantità di dati disponibili per il modello, in quanto il modello non solo viene addestrato ma anche testato su tutti i dati disponibili.

In questo esercizio costruirai un modello di regressione lineare e poi userai una convalida incrociata di 6 volte per valutarne l'accuratezza nel prevedere le vendite con la spesa pubblicitaria sui social media. Verrà visualizzato il punteggio individuale per ciascuna delle sei pieghe.

Il set di dati sales_df è stato suddiviso in y per la variabile target e X per le caratteristiche e precaricato per te. LinearRegression è stato importato da sklearn.linear_model.

Questo esercizio fa parte del corso

Apprendimento supervisionato con scikit-learn

Visualizza il corso

Istruzioni dell'esercizio

  • Importazione di KFold e cross_val_score.
  • Crea kf chiamando KFold(), impostando il numero di split a sei, shuffle a True, e impostando un seme di 5.
  • Esegui una convalida incrociata utilizzando reg su X e y, passando kf a cv.
  • Stampa il sito cv_scores.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the necessary modules
from ____.____ import ____, ____

# Create a KFold object
kf = ____(n_splits=____, shuffle=____, random_state=____)

reg = LinearRegression()

# Compute 6-fold cross-validation scores
cv_scores = ____(____, ____, ____, cv=____)

# Print scores
print(____)
Modifica ed esegui il codice