Veriyi eğitim ve test olarak ayır
Şimdi birkaç basit adımı izleyerek uçtan uca bir Machine Learning modeli kurmaya hazırsın! Modelleme ayrıntılarını sonraki bölümlerde çok daha derinlemesine keşfedeceksin, ama şimdilik temel adımları pratik ederek kavramanı istiyoruz.
Bağımsız özellikler senin için X adlı bir pandas DataFrame’ine, bağımlı değerler ise Y adlı bir pandas Series’ine yüklendi.
Ayrıca sklearn kütüphanesinden train_test_split fonksiyonu da yüklendi. Şimdi eğitim ve test veri kümelerini oluşturacak ve verinin doğru şekilde bölündüğünü kontrol edeceksin.
Bu egzersiz
Python ile Pazarlama için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
XveY’yi, verinin %25’i testte olacak şekilde eğitim ve test kümelerine ayır.- Eğitim veri kümesinin orijinal verinin sadece %75’ini içerdiğinden emin ol.
- Test veri kümesinin orijinal verinin sadece %25’ini içerdiğinden emin ol.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Split X and Y into training and testing datasets
train_X, test_X, train_Y, test_Y = ___(___, ___, test_size=0.___)
# Ensure training dataset has only 75% of original X data
print(___.shape[0] / X.shape[0])
# Ensure testing dataset has only 25% of original X data
print(___.shape[0] / ___.shape[0])