ComenzarEmpieza gratis

Calcula las combinaciones posibles

El data frame healthcare_cat_df contiene variables categóricas sobre personas empleadas en una empresa de atención sanitaria y si dejaron la empresa o no. Usarás este conjunto de datos para determinar cuántas combinaciones de valores de las variables existen en el conjunto.

Al entrenar un modelo de Machine Learning, te interesa que tus datos contengan muchas observaciones de cada combinación. Por eso, el número de combinaciones te ayuda a establecer una referencia del mínimo de observaciones que tendrías que recopilar para evitar sesgos en tu modelo.

El paquete tidyverse ya está cargado.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Calcula el número mínimo de observaciones necesarias para representar todas las combinaciones de valores de variables en healthcare_cat_df.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the minimum number of value combinations
healthcare_cat_df %>% 
  ___(___(___(), ~ ___(unique(.)))) %>% 
  ___()
Editar y ejecutar código