Aan de slagGa gratis aan de slag

Implementeer cross_val_score()

Je bedrijf heeft een paar nieuwe snoepjes ontwikkeld, maar weet nog niet of ze alle vijf op de markt moeten komen. Om de populariteit van deze nieuwe snoepjes te voorspellen, is aan jou gevraagd om een regressiemodel te bouwen met de candy-gegevensset. Denk eraan dat de responswaarde het head-to-head winstpercentage tegen andere snoepjes is.

Voordat je verschillende regressiemodellen gaat proberen, besluit je eerst cross-validatie uit te voeren op een simpel random forest-model om een basisfout te krijgen om toekomstige resultaten mee te vergelijken.

Deze oefening maakt deel uit van de cursus

Modelvalidatie in Python

Cursus bekijken

Oefeninstructies

  • Vul cross_val_score() in.
    • Gebruik X_train als trainingsdata en y_train als respons.
    • Gebruik rfc als model, 10-voudige cross-validatie en mse als scoringsfunctie.
  • Print het gemiddelde van de cv-resultaten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

rfc = RandomForestRegressor(n_estimators=25, random_state=1111)
mse = make_scorer(mean_squared_error)

# Set up cross_val_score
cv = cross_val_score(estimator=____,
                     X=____,
                     y=____,
                     cv=____,
                     scoring=____)

# Print the mean error
print(cv.____())
Code bewerken en uitvoeren