1. Nauka
  2. /
  3. Projekty
  4. /
  5. HR Analytics: analiza danych pracowniczych w R

Connected

ćwiczenie

Wczytywanie dodatkowych danych

Skoro liczba godzin nadliczbowych nie zmieniła się istotnie między latami, warto sprawdzić inne zmienne. Po konsultacji z zespołem pada propozycja, żeby przyjrzeć się wynikom badań zaangażowania – a konkretnie liczbie niezaangażowanych pracowników w danej lokalizacji. Dane z ankiety nie są jeszcze gotowe, więc trzeba je wczytać i dołączyć do dotychczas używanych danych. Wykonywanie wielu złączeń to standard w analityce HR.

Po złączeniu zamień year na factor(year). Ponieważ rok interesuje cię wyłącznie jako zmienna grupująca – a nie jako wartość liczbowa – przekształcenie go na czynnik ułatwi dalszą analizę.

Instrukcje

100 XP
  • Zaimportuj plik "survey_data_2.csv" jako survey_data przy użyciu read_csv().
  • Użyj left_join(), aby dodać dane o zaangażowaniu do hr_joined. Złącz po roku, a następnie po identyfikatorze pracownika.
  • Korzystając z %>% po złączeniu, użyj mutate(), aby dodać zmienną disengaged – przyjmuje wartość 1, gdy engagement wynosi 2 lub mniej, i 0 w pozostałych przypadkach – oraz zastąp year wartością factor(year). Wynik tych kroków przypisz do safety.