LoslegenKostenlos loslegen

Train/Test-Split

Um Overfitting zu vermeiden, ist es in der Machine Learning-Praxis üblich, die Daten in Trainings- und Testdatensätze zu teilen. So stellst du sicher, dass das Modell neue, unbekannte Daten korrekt vorhersagen kann.

Da wir mit Zeitreihendaten arbeiten, können wir keine zufälligen Splits verwenden — sonst könnte das Modell in die Zukunft schauen.

Eine Funktion, die den Anfang und das Ende eines DataFrames ausgibt, ist als show_start_end() verfügbar. Sie nimmt einen DataFrame als einziges Argument und gibt einen String zurück.

Die Daten liegen als environment vor.

Diese Übung ist Teil des Kurses

IoT-Daten in Python analysieren

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define the split day
limit_day = ____

# Split the data
train_env = ____[____]
test_env = ____[____]
Code bearbeiten und ausführen