CommencerCommencer gratuitement

Normalisation et standardisation

Le redimensionnement des variables (feature scaling) permet d’éviter qu’une caractéristique ne domine les autres lors de la modélisation. La normalisation et la standardisation sont des techniques largement utilisées. La normalisation met généralement les variables à l’échelle dans l’intervalle [0, 1], afin qu’elles aient des ordres de grandeur comparables. La standardisation transforme les données pour obtenir une moyenne nulle et une variance unitaire, ce qui conserve mieux les valeurs extrêmes et ne borne pas l’intervalle. matplotlib.pyplot a été importé sous le nom plt, MinMaxScaler et StandardScaler ont été importés, et les variables explicatives des données sur les maladies cardiaques, déjà séparées, ont été importées sous les noms X_train et X_test.

Cet exercice fait partie du cours

Machine Learning de bout en bout

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Show the initial distribution of 'age'
age = ____
plt.figure(figsize=(10,5))
plt.hist(____, bins=30, alpha=0.5, label='Original')
plt.legend(prop={'size': 16})
plt.title('Histogram with Original Age'); 
plt.xlabel('Age'); plt.ylabel('Count');
plt.show()
Modifier et exécuter le code