IniziaInizia gratis

Codifica le variabili categoriali e scala quelle numeriche

In questo passaggio finale, eseguirai la one-hot encoding sulle variabili categoriali e poi scalerai le colonne numeriche. La libreria pandas è già stata caricata come pd, così come il modulo StandardScaler da sklearn.preprocessing.

Il dataset grezzo di churn telecom telco_raw è stato caricato come DataFrame di pandas, insieme alle liste custid, target, categorical e numerical con i nomi delle colonne che hai creato nell'esercizio precedente. Per prendere familiarità con il dataset, esploralo nella console.

Questo esercizio fa parte del corso

Machine Learning per il marketing con Python

Visualizza il corso

Istruzioni dell'esercizio

  • Esegui la one-hot encoding sulle variabili categoriali.
  • Inizializza un'istanza di StandardScaler.
  • Esegui fit e transform dello scaler sulle colonne numeriche.
  • Crea un DataFrame a partire da scaled_numerical.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Perform one-hot encoding to categorical variables 
telco_raw = pd.get_dummies(data = ___, columns = categorical, drop_first=True)

# Initialize StandardScaler instance
scaler = ___()

# Fit and transform the scaler on numerical columns
scaled_numerical = ___.fit_transform(telco_raw[___])

# Build a DataFrame from scaled_numerical
scaled_numerical = pd.DataFrame(___, columns=numerical)
Modifica ed esegui il codice