Centrer et mettre à l’échelle manuellement
Nous avons chargé le même jeu de données nommé data. Votre objectif est maintenant de le centrer et de le mettre à l’échelle manuellement.
Les bibliothèques pandas, numpy, seaborn et matplotlib.pyplot ont été chargées sous les alias pd, np, sns et plt respectivement. N’hésitez pas à explorer le jeu de données dans la console.
Cet exercice fait partie du cours
Customer Segmentation in Python
Instructions
- Centrez les données en soustrayant la valeur moyenne de chaque entrée.
- Mettez les données à l’échelle en divisant chaque entrée par l’écart type.
- Combinez les deux actions ci-dessus et normalisez les données en appliquant à la fois le centrage et la mise à l’échelle.
- Affichez les statistiques récapitulatives pour vérifier que la moyenne est égale à zéro et que l’écart type est égal à un, et arrondissez la sortie à 2 décimales.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Center the data by subtracting average values from each entry
data_centered = data - data.____()
# Scale the data by dividing each entry by standard deviation
data_scaled = ____ / ____.____()
# Normalize the data by applying both centering and scaling
data_normalized = (____ - data.____()) / data.____()
# Print summary statistics to make sure average is zero and standard deviation is one
print(data_normalized.____().round(____))