MulaiMulai sekarang secara gratis

Enkode variabel kategorikal dan skala variabel numerik

Pada langkah terakhir ini, Anda akan melakukan one-hot encoding pada variabel kategorikal lalu men-skala kolom numerik. Pustaka pandas telah dimuat untuk Anda sebagai pd, begitu juga modul StandardScaler dari modul sklearn.preprocessing.

Himpunan data churn telecom mentah telco_raw telah dimuat untuk Anda sebagai DataFrame pandas, begitu pula daftar custid, target, categorical, dan numerical dengan nama kolom yang Anda buat pada latihan sebelumnya. Anda dapat membiasakan diri dengan himpunan data tersebut dengan mengeksplorasinya di konsol.

Latihan ini adalah bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Petunjuk latihan

  • Lakukan one-hot encoding pada variabel kategorikal.
  • Inisialisasi sebuah instance StandardScaler.
  • Fit dan transformasikan scaler pada kolom numerik.
  • Bangun sebuah DataFrame dari scaled_numerical.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Perform one-hot encoding to categorical variables 
telco_raw = pd.get_dummies(data = ___, columns = categorical, drop_first=True)

# Initialize StandardScaler instance
scaler = ___()

# Fit and transform the scaler on numerical columns
scaled_numerical = ___.fit_transform(telco_raw[___])

# Build a DataFrame from scaled_numerical
scaled_numerical = pd.DataFrame(___, columns=numerical)
Edit dan Jalankan Kode