1. Nauka
  2. /
  3. Kursy
  4. /
  5. Redukcja wymiarowości w R

Connected

ćwiczenie

Obliczanie możliwych kombinacji

Ramka danych healthcare_cat_df zawiera zmienne kategoryczne dotyczące pracowników firmy z branży opieki zdrowotnej oraz informację o tym, czy dany pracownik odszedł z firmy. Skorzystasz z tego zbioru danych, aby określić liczbę kombinacji wartości cech istniejących w zbiorze.

Podczas trenowania modelu uczenia maszynowego zależy ci na tym, żeby dane zawierały wiele obserwacji dla każdej kombinacji. Liczba kombinacji pozwala więc wyznaczyć minimalną liczbę obserwacji, które trzeba zebrać, aby uniknąć błędu systematycznego w modelu.

Pakiet tidyverse jest już wczytany.

Instrukcje

100 XP
  • Oblicz minimalną liczbę obserwacji potrzebną do reprezentowania wszystkich kombinacji wartości cech w zbiorze healthcare_cat_df.