Aan de slagGa gratis aan de slag

Categorische variabelen bekijken

Onthoud uit de vorige oefening dat:

  • Ordinale variabelen twee of meer categorieën hebben die gerangschikt of geordend kunnen worden
  • Nominale variabelen twee of meer categorieën hebben die geen intrinsieke volgorde hebben

In je gegevensset:

  • salary is een ordinale variabele
  • department is een nominale variabele

In deze oefening ga je de categorische variabelen bekijken die je in de vorige oefening hebt gevonden. Om dat te doen importeer je eerst de bibliotheek pandas en lees je het CSV-bestand "turnover.csv" in. Daarna print je de unieke waarden van deze variabelen.

Deze oefening maakt deel uit van de cursus

HR-analytics: verloop van medewerkers voorspellen in Python

Cursus bekijken

Oefeninstructies

  • Importeer pandas (als pd) om de data in te lezen (dit is al voor je gedaan).
  • Lees het bestand "turnover.csv" en sla het op in een DataFrame met de naam data.
  • Print de unieke waarden van de kolom "department".
  • Print de unieke waarden van de kolom "salary".

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import pandas (as pd) to read the data
import pandas as pd

# Read "turnover.csv" file and save it in a DataFrame called data
data = pd.read_csv(____)

# Print the unique values of the "department" column
print(data.____.____())

# Print the unique values of the "salary" column
print(data.____.____())
Code bewerken en uitvoeren