Train/Test ayrımı
Aşırı uyumu önlemek için Machine Learning'de veriyi eğitim ve test veri kümelerine ayırmak yaygın bir pratiktir. Bu, modelin yeni ve daha önce görmediği verileri doğru tahmin edebilmesini sağlamak için yapılır.
Zaman serisi verileriyle çalıştığımız için rastgele ayırma yöntemlerini kullanamayız; çünkü bu, modelin geleceği “bilmesine” yol açar.
Bir DataFrame'in başlangıç ve bitişini yazdırmak için show_start_end() adlı bir fonksiyon mevcut. Bu fonksiyon tek parametre olarak bir DataFrame alır ve bir string döndürür.
Veri environment olarak mevcut.
Bu egzersiz, kursun bir parçasıdır
Python ile IoT Verilerini Analiz Etmek
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Define the split day
limit_day = ____
# Split the data
train_env = ____[____]
test_env = ____[____]