Da zero a eroe
Hai imparato a creare una specifica di modello e a suddividere i dati in training set e test set. Sai anche come evitare squilibri di classe nello split. È il momento di mettere insieme quanto hai appreso nella lezione precedente e costruire il modello usando solo il training set!
Stai per creare una vera e propria machine learning pipeline. Comprende la creazione della specifica del modello, la suddivisione dei dati in training e test set e, ultimo ma non meno importante, il fit del training set su un modello. Buon lavoro!
Questo esercizio fa parte del corso
Machine Learning con modelli ad albero in R
Istruzioni dell'esercizio
- Crea
diabetes_split, uno split in cui il training set contiene tre quarti di tutte le righe didiabetese in cui training e test set hanno una distribuzione simile nella variabileoutcome. - Costruisci la specifica di un albero di decisione per il tuo modello usando il motore
rparte salvala cometree_spec. - Effettua il fit di un modello
model_trainedusando i dati di training didiabetes_split, conoutcomecome variabile target ebmieskin_thicknesscome predittori.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
set.seed(9)
# Create the balanced data split
diabetes_split <- ___
# Build the specification of the model
tree_spec <- ___ %>%
___ %>%
___
# Train the model
model_trained <- ___ %>%
fit(___,
___)
model_trained