LoslegenKostenlos loslegen

Übersicht über die Stammdaten

Bisher hast du Informationen aus den Datensätzen rating und survey mit deinem ursprünglichen Datensatz kombiniert.

Wir haben mehrere weitere mitarbeiterbezogene Informationen wie compensation, no_leaves_taken (Anzahl der genommenen Urlaubstage), hiring_source usw. im Datensatz org_final ergänzt. Schau dir diesen Datensatz an, bevor du im nächsten Kapitel mit dem Feature Engineering beginnst.

Diese Übung ist Teil des Kurses

HR Analytics: Mitarbeiterfluktuation in R vorhersagen

Kurs anzeigen

Anleitung zur Übung

  • Verwende glimpse(), um die Struktur des Datensatzes org_final zu betrachten.
  • Weisen die Anzahl der Variablen im Datensatz org_final der Variable variables zu.
  • Erzeuge ein Boxplot, um die Verteilung von distance_from_home für Active- und Inactive-Mitarbeitende zu visualisieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# View the structure of the dataset
___

# Number of variables in the dataset
variables <- ___

# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
  ___
Code bearbeiten und ausführen