CommencerCommencer gratuitement

Observer les variables catégorielles

Rappelez-vous, d’après l’exercice précédent :

  • Les variables ordinales ont au moins deux catégories qui peuvent être classées ou ordonnées.
  • Les variables nominales ont au moins deux catégories qui n’ont pas d’ordre intrinsèque.

Dans votre jeu de données :

  • salary est une variable ordinale
  • department est une variable nominale

Dans cet exercice, vous allez examiner les variables catégorielles identifiées précédemment. Pour cela, vous allez d’abord importer la bibliothèque pandas et lire le fichier CSV nommé "turnover.csv". Ensuite, vous afficherez les valeurs uniques de ces variables.

Cet exercice fait partie du cours

Analytique RH : prédire l’attrition des employés en Python

Afficher le cours

Instructions

  • Importez pandas (sous le nom pd) pour lire les données (cela a déjà été fait pour vous).
  • Lisez le fichier "turnover.csv" et enregistrez-le dans un DataFrame nommé data.
  • Affichez les valeurs uniques de la colonne "department".
  • Affichez les valeurs uniques de la colonne "salary".

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import pandas (as pd) to read the data
import pandas as pd

# Read "turnover.csv" file and save it in a DataFrame called data
data = pd.read_csv(____)

# Print the unique values of the "department" column
print(data.____.____())

# Print the unique values of the "salary" column
print(data.____.____())
Modifier et exécuter le code