Manuell zentrieren und skalieren
Wir haben denselben Datensatz mit dem Namen data geladen. Dein Ziel ist es jetzt, ihn manuell zu zentrieren und zu skalieren.
Die Bibliotheken pandas, numpy, seaborn und matplotlib.pyplot wurden als pd, np, sns bzw. plt geladen. Du kannst den Datensatz gerne in der Konsole erkunden.
Diese Übung ist Teil des Kurses
Kundensegmentierung in Python
Anleitung zur Übung
- Zentriere die Daten, indem du von jedem Eintrag den Durchschnittswert abziehst.
- Skaliere die Daten, indem du jeden Eintrag durch die Standardabweichung teilst.
- Führe beide Schritte zusammen aus und normalisiere die Daten, indem du sowohl zentrierst als auch skalierst.
- Gib zusammenfassende Statistiken aus, um zu prüfen, dass der Durchschnitt null und die Standardabweichung eins ist, und runde die Ausgabe auf 2 Dezimalstellen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Center the data by subtracting average values from each entry
data_centered = data - data.____()
# Scale the data by dividing each entry by standard deviation
data_scaled = ____ / ____.____()
# Normalize the data by applying both centering and scaling
data_normalized = (____ - data.____()) / data.____()
# Print summary statistics to make sure average is zero and standard deviation is one
print(data_normalized.____().round(____))