IniziaInizia gratis

Da zero a eroe

Hai imparato a creare una specifica di modello e a suddividere i dati in training set e test set. Sai anche come evitare squilibri di classe nello split. È il momento di mettere insieme quanto hai appreso nella lezione precedente e costruire il modello usando solo il training set!

Stai per creare una vera e propria machine learning pipeline. Comprende la creazione della specifica del modello, la suddivisione dei dati in training e test set e, ultimo ma non meno importante, il fit del training set su un modello. Buon lavoro!

Questo esercizio fa parte del corso

Machine Learning con modelli ad albero in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea diabetes_split, uno split in cui il training set contiene tre quarti di tutte le righe di diabetes e in cui training e test set hanno una distribuzione simile nella variabile outcome.
  • Costruisci la specifica di un albero di decisione per il tuo modello usando il motore rpart e salvala come tree_spec.
  • Effettua il fit di un modello model_trained usando i dati di training di diabetes_split, con outcome come variabile target e bmi e skin_thickness come predittori.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

set.seed(9)

# Create the balanced data split
diabetes_split <- ___

# Build the specification of the model
tree_spec <- ___ %>% 
  ___ %>% 
  ___

# Train the model
model_trained <- ___ %>% 
  fit(___, 
      ___)

model_trained
Modifica ed esegui il codice