Train/Test-Split
Um Overfitting zu vermeiden, ist es in der Machine Learning-Praxis üblich, die Daten in Trainings- und Testdatensätze zu teilen. So stellst du sicher, dass das Modell neue, unbekannte Daten korrekt vorhersagen kann.
Da wir mit Zeitreihendaten arbeiten, können wir keine zufälligen Splits verwenden — sonst könnte das Modell in die Zukunft schauen.
Eine Funktion, die den Anfang und das Ende eines DataFrames ausgibt, ist als show_start_end() verfügbar. Sie nimmt einen DataFrame als einziges Argument und gibt einen String zurück.
Die Daten liegen als environment vor.
Diese Übung ist Teil des Kurses
IoT-Daten in Python analysieren
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the split day
limit_day = ____
# Split the data
train_env = ____[____]
test_env = ____[____]