Kategorien betrachten
Erinnere dich an die vorherige Übung:
- Ordinale Variablen haben zwei oder mehr Ausprägungen, die rangiert bzw. geordnet werden können.
- Nominale Variablen haben zwei oder mehr Ausprägungen, die keine inhärente Reihenfolge haben.
In deinem Datensatz gilt:
salaryist eine ordinale Variabledepartmentist eine nominale Variable
In dieser Übung schaust du dir die kategorialen Variablen aus der vorherigen Aufgabe an. Dazu importierst du zunächst die Bibliothek pandas und liest die CSV-Datei "turnover.csv" ein. Anschließend gibst du die eindeutigen Werte dieser Variablen aus.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation mit Python vorhersagen
Anleitung zur Übung
- Importiere
pandas(alspd), um die Daten zu lesen (das wurde bereits für dich erledigt). - Lies die Datei
"turnover.csv"ein und speichere sie in einem DataFrame namensdata. - Gib die eindeutigen Werte der Spalte
"department"aus. - Gib die eindeutigen Werte der Spalte
"salary"aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import pandas (as pd) to read the data
import pandas as pd
# Read "turnover.csv" file and save it in a DataFrame called data
data = pd.read_csv(____)
# Print the unique values of the "department" column
print(data.____.____())
# Print the unique values of the "salary" column
print(data.____.____())