Kategorik değişkenleri kodla ve sayısal değişkenleri ölçeklendir
Bu son adımda, kategorik değişkenlere one-hot encoding uygulayacak ve ardından sayısal sütunları ölçeklendireceksin. pandas kütüphanesi senin için pd olarak, ayrıca sklearn.preprocessing modülünden StandardScaler modülü de yüklendi.
Ham telekom terk veri kümesi telco_raw, bir pandas DataFrame'i olarak yüklendi. Ayrıca, önceki egzersizde oluşturduğun sütun adlarını içeren custid, target, categorical ve numerical listeleri de hazır. Konsolda veri kümesini keşfederek kendini aşinalaştırabilirsin.
Bu egzersiz, kursun bir parçasıdır
Python ile Pazarlama için Machine Learning
Egzersiz talimatları
- Kategorik değişkenlere one-hot encoding uygula.
- Bir
StandardScalerörneği başlat. scaler'ı sayısal sütunlarda fit et ve dönüştür.scaled_numerical'dan bir DataFrame oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Perform one-hot encoding to categorical variables
telco_raw = pd.get_dummies(data = ___, columns = categorical, drop_first=True)
# Initialize StandardScaler instance
scaler = ___()
# Fit and transform the scaler on numerical columns
scaled_numerical = ___.fit_transform(telco_raw[___])
# Build a DataFrame from scaled_numerical
scaled_numerical = pd.DataFrame(___, columns=numerical)