Übersicht über die Stammdaten
Bisher hast du Informationen aus den Datensätzen rating und survey mit deinem ursprünglichen Datensatz kombiniert.
Wir haben mehrere weitere mitarbeiterbezogene Informationen wie compensation, no_leaves_taken (Anzahl der genommenen Urlaubstage), hiring_source usw. im Datensatz org_final ergänzt. Schau dir diesen Datensatz an, bevor du im nächsten Kapitel mit dem Feature Engineering beginnst.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation in R vorhersagen
Anleitung zur Übung
- Verwende
glimpse(), um die Struktur des Datensatzesorg_finalzu betrachten. - Weisen die Anzahl der Variablen im Datensatz
org_finalder Variablevariableszu. - Erzeuge ein Boxplot, um die Verteilung von
distance_from_homefürActive- undInactive-Mitarbeitende zu visualisieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# View the structure of the dataset
___
# Number of variables in the dataset
variables <- ___
# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
___