Centreren en schalen met StandardScaler()

We hebben dezelfde gegevensset met de naam data geladen. Je doel is nu om deze te centreren en schalen met StandardScaler uit de sklearn-bibliotheek.

De libraries pandas, numpy, seaborn en matplotlib.pyplot zijn respectievelijk geladen als pd, np, sns en plt. We hebben ook de StandardScaler geïmporteerd.

Voel je vrij om de gegevensset te verkennen in de console.

Deze oefening maakt deel uit van de cursus

Klantsegmentatie in Python

Bekijk cursus

Oefeninstructies

Initialiseer een StandardScaler-instance als scaler en pas fit toe op de data.
Transformeer de data door deze te schalen en te centreren met scaler.
Maak een pandas DataFrame van data_normalized en voeg de index en kolomnamen van data toe.
Print samenvattende statistieken om te controleren dat het gemiddelde nul is en de standaardafwijking één, en rond de resultaten af op 2 decimalen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Initialize a scaler
scaler = ____()

# Fit the scaler
____.____(data)

# Scale and center the data
data_normalized = ____.____(data)

# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)

# Print summary statistics
print(data_normalized.____().round(____))

Code bewerken en uitvoeren