Normaliseer de variabelen

Nu de laatste stap in de datapreparatie. Je gaat de niet-scheve gegevensset wholesale_boxcox op dezelfde schaal zetten, zodat alle kolommen een gemiddelde van nul en een standaardafwijking van 1 hebben. Je gebruikt hiervoor de functie StandardScaler uit de module sklearn.preprocessing.

De niet-scheve gegevensset wholesale_coxbox die je in de vorige oefening hebt getransformeerd, is geïmporteerd als een pandas DataFrame. Ook is de StandardScaler()-instantie geïnitialiseerd als scaler.

Deze oefening maakt deel uit van de cursus

Machine Learning voor marketing in Python

Bekijk cursus

Oefeninstructies

Fit de geïnitialiseerde scaler-instantie op de met Box-Cox getransformeerde gegevensset.
Transformeer en sla de geschaalde gegevensset op als wholesale_scaled.
Maak een pandas DataFrame van de geschaalde gegevensset.
Print het gemiddelde en de standaardafwijking voor alle kolommen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)

# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)

# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
                                       index=wholesale_boxcox.___,
                                       columns=wholesale_boxcox.columns)

# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())

Code bewerken en uitvoeren