CommencerCommencez gratuitement

Ingénierie des variables

Votre mission est de prédire si une nouvelle cohorte de demandeurs de prêt risque ou non de faire défaut. Vous disposez d’un jeu de données historique et souhaitez y entraîner un classificateur. Vous remarquez que de nombreuses caractéristiques sont au format chaîne de caractères, ce qui pose problème pour vos classificateurs. Vous décidez donc d’encoder numériquement les colonnes de chaînes à l’aide de LabelEncoder(). La fonction a été préchargée pour vous depuis le sous-module preprocessing de sklearn. Le jeu de données credit est également préchargé, tout comme la liste des noms de colonnes dont le type de données est une chaîne, stockée dans non_numeric_columns.

Cet exercice fait partie du cours

<cours>Concevoir des workflows de Machine Learning en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Inspect the first few lines of your data using head()
credit.____
Modifier et exécuter le code