Aan de slagGa gratis aan de slag

Afstemmen langs het raster

Nadat je het afstemmingsraster en een dummy-specificatie hebt gemaakt, moet je een model fitten op elk rasterpunt en het resulterende model evalueren. Dit is heel eenvoudig in het tidymodels-framework met de functie tune_grid(), zoals geïntroduceerd in de dia's.

In de resterende oefeningen gebruik je de gegevensset met creditcardklanten, met de volgende kolommen:

  • still_customer: vlag (yes of no) die aangeeft of een klant nog actief klant is
  • total_trans_amt: totale som aan transacties in USD
  • customer_age: leeftijd van de klant
  • income_category: labels zoals $60K - $80K of Less than $40K om de categorie van het jaarlijkse inkomen aan te geven
  • … en nog 16 kolommen.

Bekijk gerust de customers tibble in de console! De resultaten van de vorige oefening, tree_grid en tune_spec, zijn nog geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Cursus bekijken

Oefeninstructies

  • Maak drie cross-validatiefolds van je gegevensset en sla ze op als folds.
  • Maak tune_results door de specificatie langs het raster af te stemmen met alle voorspellers om still_customer te voorspellen, je CV-folds als resamples, en metric_set(accuracy).
  • Gebruik autoplot() om de afstemmingsresultaten te plotten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

set.seed(275)

# Create CV folds of the customers tibble
folds <- ___

# Tune along the grid
tune_results <- tune_grid(___, 
                          ___,
                          resamples = ___,
                          grid = ___,
                          metrics = ___)

# Plot the tuning results
___(tune_results)
Code bewerken en uitvoeren