Afstemmen langs het raster
Nadat je het afstemmingsraster en een dummy-specificatie hebt gemaakt, moet je een model fitten op elk rasterpunt en het resulterende model evalueren.
Dit is heel eenvoudig in het tidymodels-framework met de functie tune_grid(), zoals geïntroduceerd in de dia's.
In de resterende oefeningen gebruik je de gegevensset met creditcardklanten, met de volgende kolommen:
still_customer: vlag (yes of no) die aangeeft of een klant nog actief klant istotal_trans_amt: totale som aan transacties in USDcustomer_age: leeftijd van de klantincome_category: labels zoals $60K - $80K of Less than $40K om de categorie van het jaarlijkse inkomen aan te geven- … en nog 16 kolommen.
Bekijk gerust de customers tibble in de console! De resultaten van de vorige oefening, tree_grid en tune_spec, zijn nog geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Oefeninstructies
- Maak drie cross-validatiefolds van je gegevensset en sla ze op als
folds. - Maak
tune_resultsdoor de specificatie langs het raster af te stemmen met alle voorspellers omstill_customerte voorspellen, je CV-folds als resamples, enmetric_set(accuracy). - Gebruik
autoplot()om de afstemmingsresultaten te plotten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
set.seed(275)
# Create CV folds of the customers tibble
folds <- ___
# Tune along the grid
tune_results <- tune_grid(___,
___,
resamples = ___,
grid = ___,
metrics = ___)
# Plot the tuning results
___(tune_results)