1. 学ぶ
  2. /
  3. プロジェクト
  4. /
  5. HRアナリティクス:Rで社員離職を予測する

Connected

演習

HRデータセットの結合(I)

いよいよ複数のソースから得たデータセットを結合します。ここでは、従業員IDを照合キーとして、従業員評価データを org2 に結合します。rating データセットには、2013年のパフォーマンス評価が含まれています。

パフォーマンス評価のレベルは次のとおりです:

  • Unacceptable
  • Below Average
  • Acceptable
  • Above Average
  • Excellent

2つのデータセットを結合するには、left_join() 関数を使えます。

たとえば、left_join(x, y, by = "z") は y を x に結合します。2番目に指定したデータセットが、照合キー "z" を使って最初のデータセットに結合されます。

指示

100 XP
  • glimpse() を使って rating データセットの構造を確認します。
  • 照合キーに "emp_id" を用いて、rating を org2 に左結合します。
  • 各 rating レベルの離職率を計算します。