Enkode variabel kategorikal dan skala variabel numerik
Pada langkah terakhir ini, Anda akan melakukan one-hot encoding pada variabel kategorikal lalu men-skala kolom numerik. Pustaka pandas telah dimuat untuk Anda sebagai pd, begitu juga modul StandardScaler dari modul sklearn.preprocessing.
Himpunan data churn telecom mentah telco_raw telah dimuat untuk Anda sebagai DataFrame pandas, begitu pula daftar custid, target, categorical, dan numerical dengan nama kolom yang Anda buat pada latihan sebelumnya. Anda dapat membiasakan diri dengan himpunan data tersebut dengan mengeksplorasinya di konsol.
Latihan ini adalah bagian dari kursus
Machine Learning untuk Pemasaran dengan Python
Petunjuk latihan
- Lakukan one-hot encoding pada variabel kategorikal.
- Inisialisasi sebuah instance
StandardScaler. - Fit dan transformasikan
scalerpada kolom numerik. - Bangun sebuah DataFrame dari
scaled_numerical.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Perform one-hot encoding to categorical variables
telco_raw = pd.get_dummies(data = ___, columns = categorical, drop_first=True)
# Initialize StandardScaler instance
scaler = ___()
# Fit and transform the scaler on numerical columns
scaled_numerical = ___.fit_transform(telco_raw[___])
# Build a DataFrame from scaled_numerical
scaled_numerical = pd.DataFrame(___, columns=numerical)