Kategorik değişkenleri kodla ve sayısal değişkenleri ölçeklendir
Bu son adımda, kategorik değişkenlere one-hot encoding uygulayacak ve ardından sayısal sütunları ölçeklendireceksin. pandas kütüphanesi senin için pd olarak, ayrıca sklearn.preprocessing modülünden StandardScaler modülü de yüklendi.
Ham telekom terk veri kümesi telco_raw, bir pandas DataFrame'i olarak yüklendi. Ayrıca, önceki egzersizde oluşturduğun sütun adlarını içeren custid, target, categorical ve numerical listeleri de hazır. Konsolda veri kümesini keşfederek kendini aşinalaştırabilirsin.
Bu egzersiz
Python ile Pazarlama için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Kategorik değişkenlere one-hot encoding uygula.
- Bir
StandardScalerörneği başlat. scaler'ı sayısal sütunlarda fit et ve dönüştür.scaled_numerical'dan bir DataFrame oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Perform one-hot encoding to categorical variables
telco_raw = pd.get_dummies(data = ___, columns = categorical, drop_first=True)
# Initialize StandardScaler instance
scaler = ___()
# Fit and transform the scaler on numerical columns
scaled_numerical = ___.fit_transform(telco_raw[___])
# Build a DataFrame from scaled_numerical
scaled_numerical = pd.DataFrame(___, columns=numerical)