Observer les variables catégorielles
Rappelez-vous, d’après l’exercice précédent :
- Les variables ordinales ont au moins deux catégories qui peuvent être classées ou ordonnées.
- Les variables nominales ont au moins deux catégories qui n’ont pas d’ordre intrinsèque.
Dans votre jeu de données :
salaryest une variable ordinaledepartmentest une variable nominale
Dans cet exercice, vous allez examiner les variables catégorielles identifiées précédemment. Pour cela, vous allez d’abord importer la bibliothèque pandas et lire le fichier CSV nommé "turnover.csv". Ensuite, vous afficherez les valeurs uniques de ces variables.
Cet exercice fait partie du cours
Analytique RH : prédire l’attrition des employés en Python
Instructions
- Importez
pandas(sous le nompd) pour lire les données (cela a déjà été fait pour vous). - Lisez le fichier
"turnover.csv"et enregistrez-le dans un DataFrame nommédata. - Affichez les valeurs uniques de la colonne
"department". - Affichez les valeurs uniques de la colonne
"salary".
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas (as pd) to read the data
import pandas as pd
# Read "turnover.csv" file and save it in a DataFrame called data
data = pd.read_csv(____)
# Print the unique values of the "department" column
print(data.____.____())
# Print the unique values of the "salary" column
print(data.____.____())