Normalisation et standardisation
Le redimensionnement des variables (feature scaling) permet d’éviter qu’une caractéristique ne domine les autres lors de la modélisation. La normalisation et la standardisation sont des techniques largement utilisées. La normalisation met généralement les variables à l’échelle dans l’intervalle [0, 1], afin qu’elles aient des ordres de grandeur comparables. La standardisation transforme les données pour obtenir une moyenne nulle et une variance unitaire, ce qui conserve mieux les valeurs extrêmes et ne borne pas l’intervalle. matplotlib.pyplot a été importé sous le nom plt, MinMaxScaler et StandardScaler ont été importés, et les variables explicatives des données sur les maladies cardiaques, déjà séparées, ont été importées sous les noms X_train et X_test.
Cet exercice fait partie du cours
Machine Learning de bout en bout
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Show the initial distribution of 'age'
age = ____
plt.figure(figsize=(10,5))
plt.hist(____, bins=30, alpha=0.5, label='Original')
plt.legend(prop={'size': 16})
plt.title('Histogram with Original Age');
plt.xlabel('Age'); plt.ylabel('Count');
plt.show()