Aan de slagGa gratis aan de slag

Handmatig centreren en schalen

We hebben dezelfde gegevensset geladen met de naam data. Je doel is nu om deze handmatig te centreren en te schalen.

De libraries pandas, numpy, seaborn en matplotlib.pyplot zijn respectievelijk geladen als pd, np, sns en plt. Verken de gegevensset gerust in de console.

Deze oefening maakt deel uit van de cursus

Klantsegmentatie in Python

Cursus bekijken

Oefeninstructies

  • Centreer de data door van elke waarde het gemiddelde af te trekken.
  • Schaal de data door elke waarde te delen door de standaarddeviatie.
  • Combineer de twee bovenstaande stappen en normaliseer de data door zowel te centreren als te schalen.
  • Print samenvattende statistieken om te controleren dat het gemiddelde nul is en de standaarddeviatie één, en rond de output af op 2 decimalen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Center the data by subtracting average values from each entry
data_centered = data - data.____()

# Scale the data by dividing each entry by standard deviation
data_scaled = ____ / ____.____()

# Normalize the data by applying both centering and scaling
data_normalized = (____ - data.____()) / data.____()

# Print summary statistics to make sure average is zero and standard deviation is one
print(data_normalized.____().round(____))
Code bewerken en uitvoeren