Ingénierie des variables
Votre mission est de prédire si une nouvelle cohorte de demandeurs de prêt risque ou non de faire défaut. Vous disposez d’un jeu de données historique et souhaitez y entraîner un classificateur. Vous remarquez que de nombreuses caractéristiques sont au format chaîne de caractères, ce qui pose problème pour vos classificateurs. Vous décidez donc d’encoder numériquement les colonnes de chaînes à l’aide de LabelEncoder(). La fonction a été préchargée pour vous depuis le sous-module preprocessing de sklearn. Le jeu de données credit est également préchargé, tout comme la liste des noms de colonnes dont le type de données est une chaîne, stockée dans non_numeric_columns.
Cet exercice fait partie du cours
Concevoir des workflows de Machine Learning en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Inspect the first few lines of your data using head()
credit.____