Machine-Learning-Funktionen
Im letzten Kapitel hast du einige der Funktionen zur Merkmals-Transformation aus Spark MLlib gesehen. Wenn diese Bibliothek ein Menü wäre, wären die Feature-Transformationen die Vorspeise; der Hauptgang ist eine üppige Auswahl an Machine-Learning-Modellfunktionen! Diese Funktionen beginnen alle mit ml_ und haben eine ähnliche Signatur. Sie nehmen mehrere Argumente entgegen, darunter ein Tibble, eine Formel zur Festlegung der Beziehung zwischen Variablen, einen String mit den Feature-Namen, einen String mit den Labels und mehr.
Unterstützte Machine-Learning-Funktionen umfassen lineare Regression und ihre Varianten, baumbasierte Modelle (ml_decision_tree_classifier()) und einige weitere. Du kannst die Liste aller Machine-Learning-Funktionen mit ls() anzeigen.
ls("package:sparklyr", pattern = "^ml")
Welche Argumente benötigen alle Machine-Learning-Modellfunktionen?
Diese Übung ist Teil des Kurses
Einführung in Spark mit sparklyr in R
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten