Normaliseer de variabelen
Nu de laatste stap in de datapreparatie. Je gaat de niet-scheve gegevensset wholesale_boxcox op dezelfde schaal zetten, zodat alle kolommen een gemiddelde van nul en een standaardafwijking van 1 hebben. Je gebruikt hiervoor de functie StandardScaler uit de module sklearn.preprocessing.
De niet-scheve gegevensset wholesale_coxbox die je in de vorige oefening hebt getransformeerd, is geïmporteerd als een pandas DataFrame. Ook is de StandardScaler()-instantie geïnitialiseerd als scaler.
Deze oefening maakt deel uit van de cursus
Machine Learning voor marketing in Python
Oefeninstructies
- Fit de geïnitialiseerde
scaler-instantie op de met Box-Cox getransformeerde gegevensset. - Transformeer en sla de geschaalde gegevensset op als
wholesale_scaled. - Maak een
pandasDataFrame van de geschaalde gegevensset. - Print het gemiddelde en de standaardafwijking voor alle kolommen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)
# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)
# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
index=wholesale_boxcox.___,
columns=wholesale_boxcox.columns)
# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())