Centreren en schalen met StandardScaler()
We hebben dezelfde gegevensset met de naam data geladen. Je doel is nu om deze te centreren en schalen met StandardScaler uit de sklearn-bibliotheek.
De libraries pandas, numpy, seaborn en matplotlib.pyplot zijn respectievelijk geladen als pd, np, sns en plt. We hebben ook de StandardScaler geïmporteerd.
Voel je vrij om de gegevensset te verkennen in de console.
Deze oefening maakt deel uit van de cursus
Klantsegmentatie in Python
Oefeninstructies
- Initialiseer een
StandardScaler-instance alsscaleren pasfittoe op dedata. - Transformeer de
datadoor deze te schalen en te centreren metscaler. - Maak een pandas DataFrame van
data_normalizeden voeg de index en kolomnamen vandatatoe. - Print samenvattende statistieken om te controleren dat het gemiddelde nul is en de standaardafwijking één, en rond de resultaten af op 2 decimalen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Initialize a scaler
scaler = ____()
# Fit the scaler
____.____(data)
# Scale and center the data
data_normalized = ____.____(data)
# Create a pandas DataFrame
data_normalized = pd.DataFrame(____, index=data.index, columns=data.columns)
# Print summary statistics
print(data_normalized.____().round(____))