CommencerCommencer gratuitement

Ingénierie des variables

Votre mission est de prédire si une nouvelle cohorte de demandeurs de prêt risque ou non de faire défaut. Vous disposez d’un jeu de données historique et souhaitez y entraîner un classificateur. Vous remarquez que de nombreuses caractéristiques sont au format chaîne de caractères, ce qui pose problème pour vos classificateurs. Vous décidez donc d’encoder numériquement les colonnes de chaînes à l’aide de LabelEncoder(). La fonction a été préchargée pour vous depuis le sous-module preprocessing de sklearn. Le jeu de données credit est également préchargé, tout comme la liste des noms de colonnes dont le type de données est une chaîne, stockée dans non_numeric_columns.

Cet exercice fait partie du cours

Concevoir des workflows de Machine Learning en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Inspect the first few lines of your data using head()
credit.____
Modifier et exécuter le code