Normalizza le variabili
Ora, ultimo passo della preparazione dei dati. Trasformerai l'insieme di dati non asimmetrico wholesale_boxcox sulla stessa scala, in modo che tutte le colonne abbiano media zero e deviazione standard pari a 1. Userai la funzione StandardScaler dal modulo sklearn.preprocessing.
L'insieme di dati non asimmetrico wholesale_coxbox che hai trasformato nell'esercizio precedente è stato importato come DataFrame di pandas. Inoltre, l'istanza di StandardScaler() è stata inizializzata come scaler.
Questo esercizio fa parte del corso
Machine Learning per il marketing con Python
Istruzioni dell'esercizio
- Esegui il fit dell'istanza
scalerinizializzata sul dataset trasformato con Box-Cox. - Trasforma e salva il dataset scalato come
wholesale_scaled. - Crea un DataFrame
pandasdal dataset scalato. - Stampa la media e la deviazione standard per tutte le colonne.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit the initialized `scaler` instance on the Box-Cox transformed dataset
scaler.___(wholesale_boxcox)
# Transform and store the scaled dataset as `wholesale_scaled`
wholesale_scaled = scaler.___(wholesale_boxcox)
# Create a `pandas` DataFrame from the scaled dataset
wholesale_scaled_df = pd.DataFrame(data=___,
index=wholesale_boxcox.___,
columns=wholesale_boxcox.columns)
# Print the mean and standard deviation for all columns
print(wholesale_scaled_df.agg(['___','std']).round())