Processo de feature engineering
Para incorporar feature engineering ao processo de modelagem, os conjuntos de dados de treino e teste precisam ser pré-processados antes da etapa de ajuste do modelo. Com as novas habilidades que você aprendeu neste capítulo, você vai conseguir usar todas as variáveis preditoras disponíveis nos dados de telecomunicações para treinar seu modelo de regressão logística.
Neste exercício, você vai criar um pipeline de feature engineering nos dados de telecomunicações e usá-lo para transformar os conjuntos de treino e teste.
Os conjuntos telecom_training e telecom_test, assim como a especificação do seu modelo de regressão logística, logistic_model, já foram carregados na sua sessão.
Este exercício faz parte do curso
Modelagem com tidymodels em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
telecom_recipe <- recipe(___, data = ___) %>%
# Removed correlated predictors
___(___) %>%
# Log transform numeric predictors
___(___, base = 10) %>%
# Normalize numeric predictors
___(___) %>%
# Create dummy variables
___(___, ___)