1. 学ぶ
  2. /
  3. プロジェクト
  4. /
  5. HR Analytics: Rで学ぶ従業員データの探索

Connected

演習

事故データのインポートと結合

いよいよ最終章です! ここまで到達したことをお祝いします。この章のシナリオでは、上級経営陣が「生産拠点での労働災害が今年増えているのではないか」と考えています。本当に増えているのかを確認し、もし増加しているなら、その要因を探ってほしいという依頼です。

まずは HR データと事故データをインポートしましょう。続いてそれらを結合し、事故率の分析をしやすくするために had_accident という変数を追加します。

指示

100 XP
  • read_csv() で "hr_data_2.csv" と "accident_data.csv" を読み込みます。読み込んだオブジェクトはそれぞれ hr_data、accident_data に代入します。
  • left_join() を使って HR データに事故データを追加します。従業員 ID と年の両方で結合します。
  • 結合のあとに %>% を使い、mutate() で had_accident を追加します。accident_type が NA のときは 0、それ以外は 1 とします。