Churn oranını keşfet ve veriyi böl
- Bölümde gördüğün genel bakışın üzerine ek olarak, bu derste, churn tahmini yapmak için Machine Learning kullanmadan önce gereken veri hazırlığını daha derinlemesine inceleyeceksin. Modellemeye geçmeden önce churn dağılımını keşfedecek ve veriyi eğitim ve test olarak böleceksin. Bu adımda churn oranının nasıl dağıldığını anlayacak ve veriyi ön işlemeden geçirerek eğitim kümesi üzerinde bir model kurup, kullanılmamış test verisi üzerinde performansını ölçeceksin.
Telekom veri kümesi telcom adlı bir pandas DataFrame olarak yüklendi. Hedef değişken sütununun adı Churn.
Bu egzersiz
Python ile Pazarlama için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
Churnsütunundaki benzersiz değerleri yazdır.- Her churn grubunun oranını hesapla.
- Veriyi eğitim ve test olarak bölmek için gerekli fonksiyonu içe aktar.
- Veriyi %75 eğitim ve %25 test olacak şekilde böl.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print the unique Churn values
print(___(telcom['Churn']))
# Calculate the ratio size of each churn group
telcom.___(['Churn']).size() / telcom.shape[0] * 100
# Import the function for splitting data to train and test
from sklearn.model_selection import ___
# Split the data into train and test
train, test = ___(telcom, test_size = .25)