Mettre à l’échelle une partie d’un jeu de données
Dans les vidéos précédentes, vous avez utilisé le QuantileTransformer sur l’ensemble du jeu de données. Dans cet exercice, vous allez vous entraîner à ne mettre à l’échelle qu’une partie d’un jeu de données. La raison est que les jeux de données boursiers contiennent des variables catégorielles encodées numériquement (day_of_week, day, month) qui seraient mal mises à l’échelle si vous appliquiez QuantileTransformer à l’ensemble du jeu de données.
Le transformeur a été importé depuis sklearn en même temps que le jeu de données boursier apple avec des variables supplémentaires.
Cet exercice fait partie du cours
Détection d’anomalies en Python
Instructions
- Créez une liste contenant les cinq noms de colonnes numériques de
apple. - Initialisez un
QuantileTransformerqui projette les variables sur une distribution normale. - Mettez à l’échelle et stockez simultanément les cinq colonnes dans
to_scale.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create a list of columns
to_scale = [____]
# Initialize a QuantileTransformer
qt = ____
# Scale and store simultaneously
apple.loc[____] = ____