Crea un modello random forest
Qui userai gli stessi dati di cross-validation per costruire (con train) e valutare (con validate) i random forest per ogni partizione. Poiché stai usando le stesse partizioni di cross-validation dei tuoi modelli di regressione, puoi confrontare direttamente le prestazioni dei due modelli.
Nota: Limiteremo i nostri random forest a 100 alberi per assicurarci che il fitting termini in un tempo ragionevole. Il numero predefinito di alberi per ranger() è 500.
Questo esercizio fa parte del corso
Machine Learning nel tidyverse
Istruzioni dell'esercizio
- Usa
ranger()per creare un random forest che predicalife_expectancyutilizzando tutte le caratteristiche intrainper ciascuna partizione di cross-validation. - Aggiungi una nuova colonna
validate_predictedche prevedalife_expectancyper le osservazioni invalidateusando i modelli random forest che hai appena creato.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
library(ranger)
# Build a random forest model for each fold
cv_models_rf <- cv_data %>%
mutate(model = map(___, ~ranger(formula = ___, data = ___,
num.trees = 100, seed = 42)))
# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))