ComeçarComece de graça

Pipeline completo de engenharia de atributos

O pacote recipes foi criado para codificar várias etapas de engenharia de atributos em um único objeto, facilitando a manutenção das transformações de dados em um fluxo de trabalho de Machine Learning.

Neste exercício, você vai treinar um pipeline de engenharia de atributos para preparar os dados de telecomunicações para modelagem.

A tibble telecom_df, assim como seus conjuntos telecom_training e telecom_test dos exercícios anteriores, já foram carregados no seu ambiente.

Este exercício faz parte do curso

Modelagem com tidymodels em R

Ver curso

Instruções do exercício

  • Crie uma receita que prediga canceled_service usando todas as variáveis preditoras nos dados de treinamento.
  • Remova variáveis preditoras correlacionadas usando um limiar de 0,8.
  • Normalize todos os preditores numéricos.
  • Crie variáveis dummies para todos os preditores nominais.
  • Treine sua receita com os dados de treinamento e aplique-a aos dados de teste.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>% 
  # Remove correlated predictors
  ___ %>% 
  # Normalize numeric predictors
  ___ %>% 
  # Create dummy variables
  ___

# Train your recipe and apply it to the test data
telecom_recipe %>% 
  ___ %>% 
  ___
Editar e executar o código