Standardisation par score Z

Dans l’exercice précédent, vous avez calculé le score Z pour traiter les valeurs aberrantes. Lors d’un entretien en Machine Learning, on pourrait aussi vous demander où les scores Z sont utilisés. Ils servent souvent à mettre vos données à l’échelle avant de créer un modèle.

Dans cet exercice, vous allez utiliser une fonction de sklearn.preprocessing, présentée dans la vidéo, pour standardiser les colonnes numériques du jeu de données loan_data. Rappelez-vous que cette opération met les données à l’échelle avec une moyenne de 0 et un écart-type de 1.

Le module sklearn.preprocessing a déjà été importé pour vous.

Aperçu du pipeline :

Machine learning pipeline

Cet exercice fait partie du cours

<cours>S’entraîner aux questions d’entretien en Machine Learning avec Python</cours>

Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Subset features
numeric_cols = ____.____(include=[____.____])
categoric_cols = ____.____(include=[____])

Modifier et exécuter le code