Manuell zentrieren und skalieren
Wir haben denselben Datensatz mit dem Namen data geladen. Dein Ziel ist es jetzt, ihn manuell zu zentrieren und zu skalieren.
Die Bibliotheken pandas, numpy, seaborn und matplotlib.pyplot wurden als pd, np, sns bzw. plt geladen. Du kannst den Datensatz gerne in der Konsole erkunden.
Diese Übung ist Teil des Kurses
<Kurs>Kundensegmentierung in Python</Kurs>Übungsanweisungen
- Zentriere die Daten, indem du von jedem Eintrag den Durchschnittswert abziehst.
- Skaliere die Daten, indem du jeden Eintrag durch die Standardabweichung teilst.
- Führe beide Schritte zusammen aus und normalisiere die Daten, indem du sowohl zentrierst als auch skalierst.
- Gib zusammenfassende Statistiken aus, um zu prüfen, dass der Durchschnitt null und die Standardabweichung eins ist, und runde die Ausgabe auf 2 Dezimalstellen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Center the data by subtracting average values from each entry
data_centered = data - data.____()
# Scale the data by dividing each entry by standard deviation
data_scaled = ____ / ____.____()
# Normalize the data by applying both centering and scaling
data_normalized = (____ - data.____()) / data.____()
# Print summary statistics to make sure average is zero and standard deviation is one
print(data_normalized.____().round(____))