Crea un modello random forest

Qui userai gli stessi dati di cross-validation per costruire (con train) e valutare (con validate) i random forest per ogni partizione. Poiché stai usando le stesse partizioni di cross-validation dei tuoi modelli di regressione, puoi confrontare direttamente le prestazioni dei due modelli.

Nota: Limiteremo i nostri random forest a 100 alberi per assicurarci che il fitting termini in un tempo ragionevole. Il numero predefinito di alberi per ranger() è 500.

Questo esercizio fa parte del corso

Machine Learning nel tidyverse

Visualizza corso

Istruzioni dell'esercizio

Usa ranger() per creare un random forest che predica life_expectancy utilizzando tutte le caratteristiche in train per ciascuna partizione di cross-validation.
Aggiungi una nuova colonna validate_predicted che preveda life_expectancy per le osservazioni in validate usando i modelli random forest che hai appena creato.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

library(ranger)

# Build a random forest model for each fold
cv_models_rf <- cv_data %>% 
  mutate(model = map(___, ~ranger(formula = ___, data = ___,
                                    num.trees = 100, seed = 42)))

# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))

Modifica ed esegui il codice