Ingénierie des variables
Votre mission est de prédire si une nouvelle cohorte de demandeurs de prêt risque ou non de faire défaut. Vous disposez d’un jeu de données historique et souhaitez y entraîner un classificateur. Vous remarquez que de nombreuses caractéristiques sont au format chaîne de caractères, ce qui pose problème pour vos classificateurs. Vous décidez donc d’encoder numériquement les colonnes de chaînes à l’aide de LabelEncoder(). La fonction a été préchargée pour vous depuis le sous-module preprocessing de sklearn. Le jeu de données credit est également préchargé, tout comme la liste des noms de colonnes dont le type de données est une chaîne, stockée dans non_numeric_columns.
Cet exercice fait partie du cours
<cours>Concevoir des workflows de Machine Learning en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Inspect the first few lines of your data using head()
credit.____