Aan de slagGa gratis aan de slag

Normaliseer de variabelen

Nu de laatste stap in de datapreparatie. Je gaat de niet-scheve gegevensset wholesale_boxcox op dezelfde schaal zetten, zodat alle kolommen een gemiddelde van nul en een standaardafwijking van 1 hebben. Je gebruikt hiervoor de functie StandardScaler uit de module sklearn.preprocessing.

De niet-scheve gegevensset wholesale_coxbox die je in de vorige oefening hebt getransformeerd, is geïmporteerd als een pandas DataFrame. Ook is de StandardScaler()-instantie geïnitialiseerd als scaler.

Deze oefening maakt deel uit van de cursus

Machine Learning voor marketing in Python

Cursus bekijken

Oefeninstructies

  • Fit de geïnitialiseerde scaler-instantie op de met Box-Cox getransformeerde gegevensset.
  • Transformeer en sla de geschaalde gegevensset op als wholesale_scaled.
  • Maak een pandas DataFrame van de geschaalde gegevensset.
  • Print het gemiddelde en de standaardafwijking voor alle kolommen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)

# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)

# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
                                       index=wholesale_boxcox.___,
                                       columns=wholesale_boxcox.columns)

# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())
Code bewerken en uitvoeren