1. Learn
  2. /
  3. Cursuri
  4. /
  5. Reducerea dimensionalității în R

Connected

exercițiu

Calculează combinațiile posibile

Cadrul de date healthcare_cat_df conține variabile categoriale despre angajații unei companii din domeniul sănătății și dacă aceștia au părăsit sau nu compania. Vei folosi acest set de date pentru a determina numărul de combinații ale valorilor caracteristicilor existente în set.

Atunci când antrenezi un model de machine learning, ai vrea ca datele tale să conțină multe observații pentru fiecare combinație. Astfel, numărul de combinații ajută la stabilirea unui prag minim pentru numărul de observații pe care ar trebui să le colectezi, pentru a evita bias-ul în model.

Pachetul tidyverse a fost deja încărcat pentru tine.

Instrucțiuni

100 XP
  • Calculează numărul minim de observații necesare pentru a reprezenta toate combinațiile valorilor caracteristicilor din healthcare_cat_df.