Crea un workflow recipe-modello
Il pacchetto tidymodels può combinare recipe e modelli in workflow. I workflow semplificano la creazione di una pipeline di passaggi per preparare i dati e addestrare i modelli. I workflow possono poi essere applicati facilmente a nuovi dati, senza dover ridefinire tutti i passaggi di preprocessamento e di costruzione del modello. Comodamente, i workflow hanno una funzione fit() che adatta sia la recipe sia il modello ai dati.
In questo esercizio, farai pratica nel creare una recipe e un modello e nell'aggiungerli a un workflow, così saranno pronti per essere adattati ai dati. I set train e test dei dati di abbandono dell'assistenza sanitaria dei dipendenti sono a tua disposizione. La variabile target è Attrition.
I pacchetti tidyverse e tidymodels sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Definisci una recipe usando i dati
trainconstep_filter_missing(),step_scale()estep_nzv()per rimuovere gli NA, scalare le caratteristiche numeriche e rimuovere le caratteristiche a bassa varianza, rispettivamente. Usa una soglia di 0.5 perstep_filter_missing(). - Definisci un modello di regressione logistica usando il motore "glm".
- Aggiungi
feature_selection_recipeelr_modela un workflow chiamatoattrition_wflow.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create recipe
feature_selection_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), threshold = 0.5) %>%
___(___()) %>%
___(___()) %>%
prep()
# Create model
lr_model <- ___() %>%
___("___")
# Add recipe and model to a workflow
attrition_wflow <- ___() %>%
___(___) %>%
___(___)