LoslegenKostenlos loslegen

Trainings- und Testdatensätze erstellen

Das Paket rsample ist dafür gedacht, Trainings- und Testdatensätze zu erstellen. Ein Testdatensatz ist wichtig, um abzuschätzen, wie ein trainiertes Modell voraussichtlich auf neuen Daten abschneidet. Er schützt außerdem vor Overfitting, bei dem sich ein Modell Muster „einprägt“, die nur in den Trainingsdaten vorkommen, und auf neuen Daten schlecht performt.

In dieser Übung erstellst du aus den home_sales-Daten Trainings- und Testdatensätze. Diese Daten enthalten Informationen zu zwischen 2015 und 2016 verkauften Häusern im Raum Seattle, Washington.

Die Zielvariable in diesen Daten ist selling_price.

Das Paket tidymodels ist in jeder Übung des Kurses vorab geladen. Die Tibble home_sales wurde ebenfalls für dich geladen.

Diese Übung ist Teil des Kurses

Modellierung mit tidymodels in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a data split object
home_split <- ___(home_sales, 
                  prop = ___, 
                  strata = ___)
Code bearbeiten und ausführen