Enkode variabel kategorikal dan skala variabel numerik
Pada langkah terakhir ini, Anda akan melakukan one-hot encoding pada variabel kategorikal lalu men-skala kolom numerik. Pustaka pandas telah dimuat untuk Anda sebagai pd, begitu juga modul StandardScaler dari modul sklearn.preprocessing.
Himpunan data churn telecom mentah telco_raw telah dimuat untuk Anda sebagai DataFrame pandas, begitu pula daftar custid, target, categorical, dan numerical dengan nama kolom yang Anda buat pada latihan sebelumnya. Anda dapat membiasakan diri dengan himpunan data tersebut dengan mengeksplorasinya di konsol.
Latihan ini merupakan bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Instruksi latihan
- Lakukan one-hot encoding pada variabel kategorikal.
- Inisialisasi sebuah instance
StandardScaler. - Fit dan transformasikan
scalerpada kolom numerik. - Bangun sebuah DataFrame dari
scaled_numerical.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Perform one-hot encoding to categorical variables
telco_raw = pd.get_dummies(data = ___, columns = categorical, drop_first=True)
# Initialize StandardScaler instance
scaler = ___()
# Fit and transform the scaler on numerical columns
scaled_numerical = ___.fit_transform(telco_raw[___])
# Build a DataFrame from scaled_numerical
scaled_numerical = pd.DataFrame(___, columns=numerical)