Übersicht über die Stammdaten
Bisher hast du Informationen aus den Datensätzen rating und survey mit deinem ursprünglichen Datensatz kombiniert.
Wir haben mehrere weitere mitarbeiterbezogene Informationen wie compensation, no_leaves_taken (Anzahl der genommenen Urlaubstage), hiring_source usw. im Datensatz org_final ergänzt. Schau dir diesen Datensatz an, bevor du im nächsten Kapitel mit dem Feature Engineering beginnst.
Diese Übung ist Teil des Kurses
<Kurs>HR Analytics: Mitarbeiterfluktuation in R vorhersagen</Kurs>Übungsanweisungen
- Verwende
glimpse(), um die Struktur des Datensatzesorg_finalzu betrachten. - Weisen die Anzahl der Variablen im Datensatz
org_finalder Variablevariableszu. - Erzeuge ein Boxplot, um die Verteilung von
distance_from_homefürActive- undInactive-Mitarbeitende zu visualisieren.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# View the structure of the dataset
___
# Number of variables in the dataset
variables <- ___
# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
___