Pipeline completo de engenharia de atributos
O pacote recipes foi criado para codificar várias etapas de engenharia de atributos em um único objeto, facilitando a manutenção das transformações de dados em um fluxo de trabalho de Machine Learning.
Neste exercício, você vai treinar um pipeline de engenharia de atributos para preparar os dados de telecomunicações para modelagem.
A tibble telecom_df, assim como seus conjuntos telecom_training e telecom_test dos exercícios anteriores, já foram carregados no seu ambiente.
Este exercício faz parte do curso
Modelagem com tidymodels em R
Instruções do exercício
- Crie uma receita que prediga
canceled_serviceusando todas as variáveis preditoras nos dados de treinamento. - Remova variáveis preditoras correlacionadas usando um limiar de 0,8.
- Normalize todos os preditores numéricos.
- Crie variáveis dummies para todos os preditores nominais.
- Treine sua receita com os dados de treinamento e aplique-a aos dados de teste.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___