Handmatig centreren en schalen
We hebben dezelfde gegevensset geladen met de naam data. Je doel is nu om deze handmatig te centreren en te schalen.
De libraries pandas, numpy, seaborn en matplotlib.pyplot zijn respectievelijk geladen als pd, np, sns en plt. Verken de gegevensset gerust in de console.
Deze oefening maakt deel uit van de cursus
Klantsegmentatie in Python
Oefeninstructies
- Centreer de data door van elke waarde het gemiddelde af te trekken.
- Schaal de data door elke waarde te delen door de standaarddeviatie.
- Combineer de twee bovenstaande stappen en normaliseer de data door zowel te centreren als te schalen.
- Print samenvattende statistieken om te controleren dat het gemiddelde nul is en de standaarddeviatie één, en rond de output af op 2 decimalen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Center the data by subtracting average values from each entry
data_centered = data - data.____()
# Scale the data by dividing each entry by standard deviation
data_scaled = ____ / ____.____()
# Normalize the data by applying both centering and scaling
data_normalized = (____ - data.____()) / data.____()
# Print summary statistics to make sure average is zero and standard deviation is one
print(data_normalized.____().round(____))