Categorische variabelen bekijken
Onthoud uit de vorige oefening dat:
- Ordinale variabelen twee of meer categorieën hebben die gerangschikt of geordend kunnen worden
- Nominale variabelen twee of meer categorieën hebben die geen intrinsieke volgorde hebben
In je gegevensset:
salaryis een ordinale variabeledepartmentis een nominale variabele
In deze oefening ga je de categorische variabelen bekijken die je in de vorige oefening hebt gevonden. Om dat te doen importeer je eerst de bibliotheek pandas en lees je het CSV-bestand "turnover.csv" in. Daarna print je de unieke waarden van deze variabelen.
Deze oefening maakt deel uit van de cursus
HR-analytics: verloop van medewerkers voorspellen in Python
Oefeninstructies
- Importeer
pandas(alspd) om de data in te lezen (dit is al voor je gedaan). - Lees het bestand
"turnover.csv"en sla het op in een DataFrame met de naamdata. - Print de unieke waarden van de kolom
"department". - Print de unieke waarden van de kolom
"salary".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import pandas (as pd) to read the data
import pandas as pd
# Read "turnover.csv" file and save it in a DataFrame called data
data = pd.read_csv(____)
# Print the unique values of the "department" column
print(data.____.____())
# Print the unique values of the "salary" column
print(data.____.____())