Usa cross_val_score()
La tua azienda ha creato diverse nuove caramelle da vendere, ma non è sicura se lanciare tutte e cinque. Per prevedere la popolarità di queste nuove caramelle, ti è stato chiesto di costruire un modello di regressione usando il dataset delle caramelle. Ricorda che la variabile di risposta è la percentuale di vittorie testa a testa contro altre caramelle.
Prima di provare diversi modelli di regressione, hai deciso di eseguire la cross-validation su un semplice modello di random forest per ottenere un errore di base con cui confrontare i risultati futuri.
Questo esercizio fa parte del corso
Validazione dei modelli in Python
Istruzioni dell'esercizio
- Compila
cross_val_score().- Usa
X_traincome dati di training ey_traincome variabile di risposta. - Usa
rfccome modello, una cross-validation a 10 fold emsecome funzione di scoring.
- Usa
- Stampa la media dei risultati di
cv.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
mse = make_scorer(mean_squared_error)
# Set up cross_val_score
cv = cross_val_score(estimator=____,
X=____,
y=____,
cv=____,
scoring=____)
# Print the mean error
print(cv.____())