Abwägung zwischen Geschwindigkeit und Genauigkeit
Im letzten Video hast du gesehen, dass es zwei Stellschrauben gibt, mit denen du die Leistung von Random Forests beeinflussen kannst:
- Anzahl der Entscheidungsbäume in jedem Forest.
- Anzahl der Variablen, die innerhalb der Entscheidungsbäume zum Splitten verwendet werden.
Wenn du eine der beiden erhöhst, kann das die Genauigkeit des Imputationsmodells verbessern, benötigt aber auch mehr Laufzeit. In dieser Übung probierst du das selbst aus, indem du missForest() zweimal mit unterschiedlichen Einstellungen auf die biopics-Daten anwendest. Achte dabei auf die ausgegebenen Fehler und darauf, wie lange der Code läuft.
Diese Übung ist Teil des Kurses
Fehlende Daten mit Imputationen in R behandeln
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set number of trees to 5 and number of variables used for splitting to 2
imp_res <- missForest(biopics, ___ = ___, ___ = ___)
# Print the resulting imputation errors
print(___)