Calcular combinações possíveis
O data frame healthcare_cat_df contém variáveis categóricas sobre colaboradores de uma empresa de saúde e se eles saíram da empresa ou não. Você usará este conjunto de dados para determinar quantas combinações dos valores das variáveis existem no conjunto de dados.
Ao treinar um modelo de Machine Learning, você vai querer que seus dados tenham muitas observações de cada combinação. Assim, o número de combinações ajuda a criar uma referência para a quantidade mínima de observações que você precisaria coletar para evitar viés no seu modelo.
O pacote tidyverse já foi carregado para você.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Calcule o número mínimo de observações necessário para representar todas as combinações dos valores das variáveis em
healthcare_cat_df.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the minimum number of value combinations
healthcare_cat_df %>%
___(___(___(), ~ ___(unique(.)))) %>%
___()