Kategorische Variablen finden
Kategorische Variablen sind Variablen, die nur eine begrenzte Anzahl von Werten annehmen, die eine Kategorie beschreiben. Sie können zwei Typen haben:
- Ordinal – Variablen mit zwei oder mehr Kategorien, die geordnet oder gerankt werden können (z. B. „niedrig“, „mittel“, „hoch“)
- Nominal – Variablen mit zwei oder mehr Kategorien, die keine natürliche Reihenfolge haben (z. B. „Männer“, „Frauen“)
In dieser Übung findest du die kategorischen Variablen im Datensatz. Dazu importierst du zuerst die Bibliothek pandas und liest die CSV-Datei "turnover.csv" ein. Nachdem du dir die ersten 5 Zeilen angesehen und (visuell) erkannt hast, dass es nicht-numerische Werte im DataFrame gibt, holst du dir Informationen über die Variablentypen, die im Datensatz enthalten sind.
Diese Übung ist Teil des Kurses
HR Analytics: Mitarbeiterfluktuation mit Python vorhersagen
Anleitung zur Übung
- Importiere
pandas(alspd), um die Daten einzulesen. - Lies die Datei
"turnover.csv"und speichere sie in einem DataFrame namensdata. - Wirf einen schnellen Blick auf die ersten 5 Zeilen der Daten.
- Hol dir mit
info()ein paar Informationen zu den Variablentypen in den Daten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import pandas (as pd) to read the data
import ____ as pd
# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")
# Take a quick look to the first 5 rows of data
print(data.____())
# Get some information on the types of variables in data
data.____()